JP2010009509A - 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 - Google Patents

画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 Download PDF

Info

Publication number
JP2010009509A
JP2010009509A JP2008171178A JP2008171178A JP2010009509A JP 2010009509 A JP2010009509 A JP 2010009509A JP 2008171178 A JP2008171178 A JP 2008171178A JP 2008171178 A JP2008171178 A JP 2008171178A JP 2010009509 A JP2010009509 A JP 2010009509A
Authority
JP
Japan
Prior art keywords
character
data
electronic document
layout
drawing data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008171178A
Other languages
English (en)
Other versions
JP2010009509A5 (ja
JP5121599B2 (ja
Inventor
Taeko Yamazaki
妙子 山▲崎▼
Tomotoshi Kanatsu
知俊 金津
Makoto Enomoto
誠 榎本
Kitahiro Kaneda
北洋 金田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008171178A priority Critical patent/JP5121599B2/ja
Priority to US12/486,245 priority patent/US8571359B2/en
Publication of JP2010009509A publication Critical patent/JP2010009509A/ja
Publication of JP2010009509A5 publication Critical patent/JP2010009509A5/ja
Application granted granted Critical
Publication of JP5121599B2 publication Critical patent/JP5121599B2/ja
Priority to US14/034,723 priority patent/US8965125B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • G06V30/127Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】文字コードデータとベクトル描画データの両方を一覧し、再編集可能な状態で提供する。
【解決手段】画像から、文字領域をベクトル化した情報と文字認識した情報をそれぞれの格納先に保存した電子データを生成する。このように生成した電子データは、表示・編集プログラムにおいては、入力された画像から生成されたデータとして、文字コードデータとベクトルデータの両方が提示されているため、ユーザはどちらのデータも直ちに利用することができる。
【選択図】図2

Description

本発明は、文書画像に対して画像処理を実施する画像処理装置に関する。
近年、インターネットに代表されるようなネットワークの広がりにより、文書が電子的に配布される機会も増えているが、電子文書が紙に印刷された状態で配布されることも多い。そこで、紙文書のみが手元に存在する場合でも、その内容を紙から再利用可能な電子データとして得られるようにするための技術が考えられている。
たとえば、端末から、紙文書をスキャンして得た文書画像をサーバに送信し、サーバ上でこれを文字認識し、再利用可能なフォーマットに変換して端末に戻す技術がある(特許文献1参照)。
また、文書画像を種類に対応した領域に分けて、個別に出力できるようにする技術もある(特許文献1参照)。
特開平11−167532号公報 特開平09−091450号公報 特許第3026592号公報 特開2005−346137号公報 特開2007−272601号公報
ユーザが再利用したいデータの形式は場合によって異なるが、それぞれがユーザにとって抽出しやすい形態とされることが望まれる。また、文字認識技術にも限界があり、ある程度の誤判定もでてくる。再利用するコンテンツの認識精度が低ければ、逆にユーザにとっては使いにくいデータになる。特許文献1では再利用できるデータ形式は文字情報のみであり、認識精度を加味せずに変換している。しかし、紙文書においては、文書中のコンテンツそのもののほかに、紙面上のレイアウトや位置関係が重要な意味を持つことが多い。
また、特許文献2では、文書を分割しそれぞれを出力しているため、コンテンツ同志の関係が欠落してしまう。
また、画像内に含まれている文字画像について、ユーザが、ベクトルデータとして再利用したり、文字認識結果の文字コードとして再利用したりするのが、容易に行えるようにしたいという課題もある。
前記課題を解決するために、本発明の画像処理装置は、画像を解析し文字領域を抽出する解析手段と、前記解析手段で得られた文字領域について文字認識を行い、認識結果の文字コードデータを得る文字認識手段と、前記解析手段で得られた文字領域についてベクトル化を行い、ベクトル描画データを得るベクトル化手段と、前記文字認識手段で得られた文字コードデータと前記ベクトル化手段で得られたベクトル描画データとについて、電子ドキュメント内の格納先を決定する決定手段と、前記文字コードデータおよび前記ベクトル描画データを前記決定手段で決定された格納先に格納した電子ドキュメントを生成する電子ドキュメント生成手段とを備えることを特徴とする。
文字領域の認識結果である文字コードデータと、ベクトル描画データの両方が提供されるので、ユーザが所望するデータを容易に利用できるようになる。また、再編集可能な状態での認識結果の提供が可能となる。更に、各ベクトル描画データが、入力画像と同じレイアウトで配置されるので、ユーザにとって、各文字領域のベクトル描画データ間の位置関係がわかり易く表示されることになり、閲覧や編集を行いやすくなる。
<実施形態1>
以下、図面を参照して本発明の好適な実施形態を詳細に説明する。
[システム構成]
はじめに、本発明の第1の実施形態である画像処理装置を含むシステムの全体構成について、図1を用いて説明する。
図1は、本実施形態1におけるシステム構成の一例を示す図である。
同図において、100は、画像処理装置であり、以下の構成からなる。101は、文書を読み取って画像データに変換するスキャナである。102は、スキャナ101から得られる画像データに、後述の画像処理を施すための電子ドキュメント生成プログラムやその他のプログラムを実行するCPUである。103は、CPU102がこれらのプログラムを実行する際のワークメモリやデータの一時保存などに利用されるメモリであり、104はこれらのプログラムやデータを格納するハードディスクである。また、105は、外部装置とデータの入出力を行うためのネットワークI/Fである。なお、画像処理装置100は、スキャナ部101に加えて、ファックスやコピーやプリンタなどの機能を備える複合機であってもよい。
パーソナルコンピュータ(PC)120は、画像処理装置100とLAN110などのネットワークで接続され、画像処理装置100から送信されるデータを受信する。PC120では、受信した電子ドキュメントを画面に表示し編集することが可能な表示・編集プログラム121を実行したり、またその電子ドキュメントの一部を別の再利用プログラム122によって利用することが可能である。
[画像処理装置100の概要]
続いて、本実施形態1における画像処理装置100の概要を、図2を用いて説明する。
図2は、本実施形態1における画像処理装置100の電子ドキュメント生成に係る構成と入出力されるデータを説明する図である。
図2に示す各処理は、CPU102が電子ドキュメント生成プログラムを実行することによって実現されるものとするが、その一部又は全部を電気回路で構成するようにしても構わない。
同図において、200はスキャナ101から入力された入力画像である。なお、本実施形態において入力画像はスキャナから入力された画像としたが、これに限るものではなく、例えば、ファックスなどを介して受信した画像を入力画像として入力するようにしてもよい。
210は、この入力画像から電子ドキュメントを生成するための電子ドキュメント生成部(電子ドキュメント生成プログラム)である。
220は、電子ドキュメント生成部210により生成された電子ドキュメントである。
なお、ブロック211〜215は、電子ドキュメント生成部210で実行される各処理を模式的に示したものであり、以下のものから構成される。
211は、入力された文書画像を解析し文字領域を抽出する解析部である。
212は、解析部211によって抽出された文字領域について文字認識を行い、認識された文字を文字コードデータに変換する文字認識部である。
213は、解析部211によって抽出された文字領域について、それに含まれる各文字の輪郭情報を抽出し、抽出した輪郭情報をベクトル描画データに変換するベクトル化部である。
214は、文字認識部212が出力する文字コードデータと、ベクトル化部213が出力するベクトル描画データのそれぞれが格納される、220の電子ドキュメント内の格納先を決定する格納先決定部である。
215は、格納先決定部214で決定した格納先に応じて、文字コードデータとベクトル描画データとを電子ドキュメント220のフォーマットへ変換し、電子ドキュメント220を生成するフォーマット変換部である。
電子ドキュメント生成部210によって生成された電子ドキュメント220は、以下の221〜224の各データによって構成され、PC120が備える表示・編集プログラム121によって表示・編集が可能である。
221は、表示・編集プログラム121においてレイアウト編集用に用いられるデータであり、ベクトル化部213で生成されたベクトル描画データ223が格納される。また、222は表示・編集プログラム121においてテキスト編集用に用いられるデータであり、文字認識部212による認識結果の文字コードデータ224が格納される。
[電子ドキュメント生成部による処理例]
以下では、入力画像200として図3の入力画像300を電子ドキュメント生成部210が処理する場合を説明する。
解析部211で公知の画像解析処理を用いて入力画像200中の文字領域を抽出する。具体的には、画像の中から各文字を構成する画素の集合を抽出し、さらにそれらのうち文字の大きさを有する画素集合で、かつ、ほぼ同じ大きさの画素集合が少なくとも縦または横に並んでいる領域を文字領域として抽出する。文字を構成する画素の集合を抽出する手法としては、文字を構成する画素の集合として、入力多値画像から近似色画素塊を抽出する手法や、多値画像を二値化して得た黒画素塊に基づいて抽出する手法がある。あるいは多値画像から微分エッジ情報などを生成してエッジ内の画素として抽出する手法などもあるが、そのいずれを用いてもよい。
図3に示す300の例では、点線で囲まれる領域301と302がそれぞれ文字領域として抽出されたものとする。文字認識部212では公知の文字認識技術を用いて各文字領域内の文字認識を行い、文字コードデータを生成する。
ここで文字認識処理の一例について簡単に説明する。なお、ここで説明するのはあくまで一例であって別の手法を用いてもよい。
文字認識処理ではまず文字領域の縦書き横書きすなわち行方向を判断する。これは画像を二値化し、縦と横の射影をとって、この射影の分散の低いほうを行方向と判定する方法があり、これを用いることができる。
次に画像を個々の文字画像へと分割する。これは二値画像の行方向への射影を用いて切断すべき行間を決定して行画像に分割し、さらに行画像を行と垂直方向への射影を用いて切断すべき文字間を決定して文字画像へと分割すればよい。
そしてそれら文字画像ひとつひとつに対して所定の特徴量を取り、あらかじめ全字種分の特徴量を保存した辞書から一番類似するものを探し、辞書が示す対応する文字コードを各文字の認識結果とする。
図3の例では、文字領域301の認識結果として“テストテストテスト”に対応する文字コードデータと、文字領域302の認識結果として“これはテストです。本発明の為のみに使用されるものです。”に対応する文字コードデータが生成されるものとする。
ベクトル化部213では公知のベクトル化技術を用いて各文字領域の画像データから文字のベクトル描画データを生成する。ベクトル化技術の例としては、特許文献3や特許文献4に開示された方法がある。
たとえば特許文献3では、画像をラスタ走査しながら注目画素とその近傍画素の状態に基づいて、水平方向及び垂直方向の画素間ベクトルを検出する。次に、これら画素間ベクトル同士の接続状態をもとに、画像データの輪郭を抽出することで、アウトラインベクトルと呼ばれる連結画素データの周回を画素間ベクトルの集合で記述する情報を生成する技術を開示している。また、特許文献4では、アウトラインベクトルを、直線や、2次や3次のベジェ曲線で近似することで、大きく変倍しても高画質なベクトル記述データを生成する技術を開示している。
214の格納先決定部は、例えば図4に示すような、データに対し格納先を定める決定規則に基づいて、文字コードデータ、およびベクトル描画データの格納先を決定する。すなわち文字コードデータは電子ドキュメント220における224のテキスト編集用データとして、ベクトル描画データは電子ドキュメント220における221のレイアウト編集用データとしてそれぞれ格納先が決定される。
フォーマット変換部215では、文字コードデータおよびベクトル描画データを、格納先決定部214で決定された格納先に従ったフォーマットに変換して電子ドキュメント220を生成する。
[電子ドキュメントの具体例]
ここで、本実施形態1における電子ドキュメントの具体例を、図5を用いて説明する。
図5の電子ドキュメント500は、本実施形態の説明のために、XMLフォーマットに従って作られた電子ドキュメント220の具体例である。
同図の501は、電子ドキュメントのレイアウト編集用データを格納する部分で要素名<Layout>と</Layout>で挟まれた箇所に該当する。501には、ベクトル描画データ503が格納されている。なお、ベクトル描画データの各オブジェクト(各文字)は、入力画像と同じレイアウトで描画されるように位置情報も指定されているものとする。
一方、502は、テキスト編集用データを格納する部分で、要素名<Text>と</Text>で挟まれた箇所に該当する。502には文字コードデータ504が格納されている。
なお、要素名およびデータ構造は表示・編集プログラム121の仕様に準じている。表示・編集プログラム121の種類によって図5に示したもの以外の要素名やデータ構造で出力されることもありうる。
なお、表示・編集プログラム121がマイクロソフト社のパワーポイント(商標)である場合、ベクトル描画データ503はスライド領域(スライドペイン)に表示されるようにし、文字認識結果は、ノート領域(ノートペイン)に表示されるようにする。この場合、電子ドキュメント500のフォーマットは「pptx」であるとする。
[表示・編集プログラムによる表示例]
次に、図3の画像300から生成された電子ドキュメント220の例である図5の電子ドキュメント500を、図1のパーソナルコンピュータ120で実行される表示・編集プログラム121で処理する際の表示例を、図6を用いて説明する。
図6は表示・編集プログラム121に電子ドキュメント500を入力した場合の表示例である。
601は表示・編集プログラム121による表示ウィンドウの全体を示すものであり、その中にレイアウト編集ウィンドウ602、テキスト編集ウィンドウ603、要約情報表示ウィンドウ604をそれぞれ含む。表示・編集プログラム121がパワーポイントの場合、レイアウト編集ウィンドウ602はスライドペイン、テキスト編集ウィンドウ603はノートペイン、要約情報表示ウィンドウ604はアウトラインペインである。
レイアウト編集ウィンドウ602には、電子ドキュメント220中のレイアウト編集用データ221の内容に従った表示がなされる。本実施形態で例示する図5の電子ドキュメント500に対しては、ベクトル描画データ503によって図3の301および302と外観が一致する画像情報が描画されている。
このレイアウト編集ウィンドウ602内で、ユーザはベクトル描画データによって描画されたオブジェクトの拡大縮小、色情報の変更などといった編集作業が可能である。また編集後の電子ドキュメントを保存したり、602に表示されたとおりの外観で紙面を印刷することも可能である。
テキスト編集ウィンドウ603には、電子ドキュメント220中のテキスト編集用データの内容がテキストデータとして表示される。本実施形態で例示する図5の電子ドキュメント500に対しては、文字コードデータ504の内容である文字列、すなわち図3の301の文字認識結果である文字列“テストテストテスト”、および302の文字認識結果である文字列“これはテストです。本発明の為のみに使用されるものです”が連続して表示されている。
ユーザはこの603の内容を602に表示されているドキュメント外観の註釈・備考のような補助的な情報を格納するために用いることができ、さらに同ウィンドウの内容をテキストデータとして編集することが可能である。
要約情報ウィンドウ604は、電子ドキュメント220中のレイアウト編集用データ221の内容のうち、要約情報として使用されるデータの文字情報が表示される。ただし本実施形態で例示する図5の電子ドキュメント500には要約情報に使用されるデータが存在しないので、図6のように空の内容が表示されている。
以上説明したように、本実施形態の画像処理装置は、画像から、文字領域をベクトル化した情報と文字認識した情報とを、それぞれの格納先に保存した電子データを生成する。このように生成した電子データは、表示・編集プログラム121の表示画面において、入力された画像から生成されたデータとして文字コードデータとベクトル描画データの両方が提示されているため、ユーザはどちらのデータも直ちに利用することができる。すなわち本実施形態では、文字領域の認識結果である文字コードデータとベクトル描画データの両方を一覧し、再編集可能な状態での提供が可能である。更に、各ベクトル描画データが、入力画像と同じレイアウトで配置されるので、ユーザにとって、各文字領域のベクトル描画データ間の位置関係がわかり易く表示されることになり、閲覧や編集を行いやすくなる。
<実施形態2>
次に、本発明の第2の実施形態における画像処理装置について、図7を用いて説明する。
図7は、図1と同様のシステム構成で実施される、本発明の第2の実施形態における画像処理装置の電子ドキュメント生成に係る構成と入出力されるデータを説明する図である。
図2と同様に、各処理はCPU102が電子ドキュメント生成プログラムを実行することによって実現されるものとするが、その一部又は全部を電気回路で構成するようにしても構わない。
同図に示す700は、スキャナ101などから入力された入力画像である。
710は、この入力画像700から電子ドキュメントを生成するための電子ドキュメント生成部である。
720は、電子ドキュメント生成部710により生成された電子ドキュメントである。同図に示すブロック711〜717は、電子ドキュメント生成部710で実行される各処理を模式的に示したものである。
711は、入力された文書画像を解析し文字領域を抽出する解析部である。
712は、解析部711から抽出された文字領域について文字認識を行い、文字コードデータに変換する文字認識部である。
713は、解析部711から抽出された文字領域について、文字レイアウトの情報を抽出する文字レイアウト抽出部である。文字レイアウト情報にはたとえば、文字領域の座標、文字のフォント、大きさ、色などがあるが、ここでは少なくとも文字領域の座標と文字の大きさが抽出されるものとする。
714は、解析部711から抽出された文字領域について各文字の輪郭情報を抽出し、ベクトル描画データに変換するベクトル化部である。
715は、入力画像中の文字領域以外の部分、すなわち背景部分を描画するためのデータを作成する背景作成部である。
716は、電子ドキュメント720内におけるデータの格納先を決定する格納先決定部である。ここで対象となるデータは、文字認識部712が出力する文字コードデータと、同文字コードデータと文字レイアウト情報とを組みあわせたレイアウト付き文字描画データと、ベクトル化部714が出力するベクトル描画データである。
717は、文字コードデータ、レイアウト付き文字描画データ、ベクトル描画データ、背景描画データをそれぞれ電子ドキュメント720のフォーマットへ変換するフォーマット変換部である。
以上の電子ドキュメント生成部710によって生成された電子ドキュメント720は、以下の721〜727の各データによって構成され、PC120にある表示・編集プログラム121によって表示・編集が可能である。
721は表示・編集プログラム121おいてレイアウト編集用に用いられるデータであり、723と724の2種類のレイアウト付き文字描画データ、725の背景描画データ、および726のベクトル描画データによって構成される。
一方、722は、表示・編集プログラム121おいてテキスト編集用に用いられるデータであり、727の文字コードデータによって構成される。
[電子ドキュメント生成部による処理例]
以下、入力画像700として、図8の入力画像801を電子ドキュメント生成部710が処理する場合をさらに説明する。
まず解析部711が入力画像700中の文字領域を抽出する。本処理は図2中の211の説明と同じであるため説明は省略する。
800の入力画像に対しては、点線で囲まれる領域801、802および803がそれぞれ文字領域として抽出されたものとする。
認識部712は各文字領域内の文字認識を行い、文字コードデータを生成する。本処理は図2中の212の処理と同じであるため説明は省略する。
図8の入力例からは文字領域801、802、803の認識結果としてそれぞれ“ドキュメント”、“これはサンブル電子ド+ユメント”、“写真写真”という文字コードデータが得られたものとする。なお、この例では、文字領域802の認識結果には、誤認識した文字認識結果が含まれている。
次いで、文字レイアウト抽出部713が各文字領域の文字レイアウト情報を取得する。ここで抽出されるのは文字領域の座標情報と、文字の大きさの情報であるとする。ここでの文字レイアウト情報抽出は公知の抽出処理を用いるものとする。たとえば文字領域の座標情報は解析部711で当該文字領域を抽出する際に得られ、文字の大きさは文字認識部712で各文字を認識する際に得られる文字の大きさを平均した値として得ることができるが、他の方法を用いてもよい。
次に、ベクトル化部714が各文字領域の画像データから文字のベクトル描画データを生成する。本処理は図2中の213の処理と同じであるため説明は省略する。
次いで、背景作成部715が入力画像から文字領域内の文字部にあたる画素を周囲の背景と同様の色に変更させることにより、背景描画データを作成する。すなわち、入力画像の文字の画素を周囲の色で埋める処理を行うことにより、入力画像から文字部分を消した背景画像を作成する。背景作成部715の処理は公知の処理を用いればよい。たとえば特許文献5には入力画像中の文字をベクトル化し、その部分の画素を背景色で補完する処理が記載されている。
次いで、格納先決定部716が、例えば図9に示すような、データとその格納先を定める決定規則に基づいて、文字コードデータ、レイアウト付き文字描画データ、背景描画データおよびベクトル描画データの格納先を決定する。
図9の決定規則に従えば、レイアウト付き文字描画データのうち、文字コードの文字認識率が高いものは723のレイアウト付き文字描画データ1(要約表示用)として、電子ドキュメント720におけるレイアウト編集用データ721内へと格納先が決定される。一方、文字認識率の低いものは724レイアウト付き文字描画データ2(非要約表示用)として、電子ドキュメント720におけるレイアウト編集用データ721内へと、文字認識率の高いものの格納先とは別個の格納先が決定される。背景描画データは725の背景描画データとして、またベクトル描画データは726のベクトル描画データとして、721のレイアウト編集用データ内へと格納先が決定される。一方、文字コードデータは727の文字コードデータとして、722のテキスト編集用データ内へと格納先が決定される。
図9の決定規則に従う決定においては、文字認識部712が各文字の認識処理の際に辞書との比較に用いた特徴量間の距離を、領域内の全文字について平均化した値が予め定めた閾値より小さいものを文字認識率の高いデータとする。すなわち、文字領域内に含まれる各文字の類似度が高ければ、文字認識率(認識信頼度)の高いデータとする。一方、認識結果の距離を平均化した値があらかじめ定めた閾値より大きいものは文字認識率の低いデータとする。すなわち、文字領域内に含まれる文字の類似度が低ければ、文字認識率(認識信頼度)の低いデータとする。これはあくまで一例であって、別の方法で各文字の認識信頼度を定めて閾値と比較してもよい。あるいは、認識後の文字列を単語辞書と照合して合致する単語が含まれるものを文字認識率の高いデータとし、含まれないものを文字認識率の低いデータとしてもよい。
717では、各データを、716で決定された格納先に従ったフォーマットに変換して、電子ドキュメント720を構成する。
[電子ドキュメントの具体例]
ここで、本実施形態2における電子ドキュメントの具体例を、図10を用いて説明する。
図10に示す電子ドキュメント1000は、本実施形態の説明のために作られた仮想的なXMLフォーマットに従って作られた電子ドキュメント720の具体例である。
1001は電子ドキュメントのレイアウト編集用データを格納する部分で要素名<Layout>と</Layout>で挟まれた箇所に該当する。1001には、1003のレイアウト付き文字描画データ1、1004のレイアウト付き文字描画データ2、1005の背景描画データ、1006のベクトル描画データが格納されている。
1002は、テキスト編集用データを格納する部分で要素名<text>と</text>で挟まれた箇所に該当する。1002には1007の文字コードデータが格納されている。
なお、実施形態1と同じく図10の要素名およびデータ構造は、表示・編集プログラム121の仕様に準じている。したがって、表示・編集プログラム121の種類によっては、電子ドキュメント1000は、図10に示したもの以外の要素名やデータ構造で出力されることもありうる。
[表示・編集プログラムによる表示例]
次に、図8の画像800から生成された電子ドキュメント720の具体例である図10の電子ドキュメント1000を、図1のパーソナルコンピュータ120で実行される表示・編集プログラム121で処理する際の表示例を、図11を用いて説明する。
図11は表示・編集プログラム121に電子ドキュメント1000を入力した場合の表示例である。
1101は表示・編集プログラム121の表示ウィンドウの全体であり、その中に1102のレイアウト編集ウィンドウと、1103のテキスト編集ウィンドウと、1104の要約情報表示ウィンドウをそれぞれ含む。
レイアウト編集ウィンドウ1102には、電子ドキュメント720中のレイアウト編集用データ721の内容に従った表示がなされる。
図10の電子ドキュメント1000に対しては、1003のレイアウト付き文字描画データおよび1004のレイアウト付き文字描画データ、1005の背景描画データ、1006のベクトル描画データがこの順番で下から順に描画された結果が表示されている。
ただし1003および1004のレイアウト付き文字描画データの上に1005の背景描画データが描画される。つまりレイアウト付き文字描画データ1003とレイアウト付き文字描画データ1004は、背景描画データ1005に上書きされた状態で表示される。このため、実際にユーザが見えるのは背景描画データ1005に基づく背景の上に、1006のベクトル描画データが描画された状態となる。その結果、各文字から抽出された輪郭情報から生成されたベクトル描画データによって、図8の800と外観が一致する画像情報が描画されている。
前述の実施形態1と同様に、このレイアウト編集ウィンドウ1102内で、ユーザはベクトル描画データによって描画されたオブジェクトの拡大縮小、色情報の変更などといった編集作業が可能である。また編集後の電子ドキュメントを保存したり、レイアウト編集ウィンドウ1102に表示されたとおりの電子ドキュメントの外観で紙面を印刷することも可能である。
テキスト編集ウィンドウ1103には、電子ドキュメント720中のテキスト編集用データの内容がテキストデータとして表示される。
本実施形態2で例示する図10の電子ドキュメント1000に対して、図11のテキスト編集ウィンドウ1103には、“ドキュメントこれはサンブル電子ド+ユメント写真写真”が表示されている。このテキスト編集ウィンドウ1103は、レイアウト編集ウィンドウ1102に表示されているドキュメント外観のノート(註釈・備考)のような補助的な情報として用いられる。さらに同ウィンドウの内容をテキストデータとして編集することも可能である。
1104の要約情報ウィンドウは、電子ドキュメント720中のレイアウト編集用データ721の内容のうち、723のレイアウト付き文字描画データ1に含まれる文字コード情報が表示されるようになっている。
なお本実施形態の表示編集プログラムでは、レイアウト編集用データのうち<HighRecognitionText></HighRecognitionText>で挟まれた文字列を、要約情報ウィンドウに表示するレイアウト付き文字描画データ1とする。また、レイアウト編集用データのうち<LowRecognitionText></LowRecognitionText>で挟まれた文字列を、要約情報ウィンドウに表示しないレイアウト付き文字描画データ2とする。したがって、本実施形態2で例示する図10の電子ドキュメント1000に対しては、図10の1003部分に含まれる文字列「ドキュメント」と「写真写真」が、要約情報に使用されるデータとして図11の1104のように表示されている。
以上説明したように、本実施形態の画像処理装置は、レイアウト付き文字描画データを文字認識率によって決定された格納先に保存した電子データを生成する。このように生成された電子データに対して、表示・編集プログラム121は、文字認識率の高いデータを要約情報としても提示するのでユーザは信頼性の高い情報をさらに有効に再利用できる。すなわち本実施形態では、文字認識率の高いデータを積極的に再利用できるとともに、閲覧しやすい状態での提供が可能となる。また、レイアウト編集ウィンドウ上にレイアウト付き文字描画データ(すなわち文字認識結果の文字コード)が描画されているので、テキスト検索を行うと、その文字の個所がハイライト表示される。したがって、ユーザ所望のテキストの表示位置を検索しやすくなる。
なお、表示・編集プログラム121がパワーポイントの場合、レイアウト編集ウィンドウ602はスライドペイン、テキスト編集ウィンドウ603はノートペイン、要約情報表示ウィンドウ604はアウトラインペインである。この場合、文字認識結果の類似度が高い文字列だけがアウトラインペインに表示されるように、類似度が高い文字認識結果をレイアウト編集用データ部分に記述した電子ドキュメントを生成する。
<実施形態3>
次に、本発明の第3の実施形態について説明する。
上述の実施形態2では、格納先決定部716は、図9の決定規則に従って格納先を決定した。この実施形態2と同様の構成による本実施形態3においては、図12に示す決定規則に基づいて格納先を決定するものとする。
本実施形態3では、レイアウト付き文字描画データは、文字コードの文字認識率が高いものは723のレイアウト付き文字描画データ1として、電子ドキュメント720における721のレイアウト編集用データ内へと格納先が決定される。一方、文字コードの文字認識率の低いものは、文字コードの情報を削除したうえで同じく723のレイアウト付き文字描画データ1として、電子ドキュメント720における721のレイアウト編集用データ内へと格納先が決定される。
[電子ドキュメントの具体例]
ここで、本実施形態3における電子ドキュメントの具体例を、図13を用いて説明する。
図13の電子ドキュメント1300は、図8の入力画像800に対し、本実施形態3において生成された電子ドキュメント720の具体例である。
電子ドキュメント1300のレイアウト編集用データを格納する部分である1301には、文字認識率の高い文字領域801および803のデータとして図13に示す1303と1305が、723のレイアウト付き文字描画データ1として格納されている。また、文字認識率の低い文字領域802のデータとして図13に示す1304が、文字コードデータが削除された状態で、レイアウト付き文字描画データ1として格納されている。
[表示・編集プログラムによる表示例]
次に、図8の画像800から生成された電子ドキュメントの具体例である図13の電子ドキュメント1300を、図1のパーソナルコンピュータ120で実行される表示・編集プログラム121で処理する際の表示例を、図14を用いて説明する。
図14は表示・編集プログラム121に上記電子ドキュメント1300を入力した場合の表示例である。
レイアウト編集ウィンドウ1402およびテキスト編集ウィンドウ1403には図11と同様の表示がなされている。
1404の要約情報表示ウィンドウには、文字領域801および803の認識結果の間に、正確に認識できなかった文字領域802のデータ(“これはサンプル電子ドキュメント”)に対応する空行1405が表示されている。ユーザはこの空行1405に対して手動で、あるいはテキスト編集ウィンドウ1403の該当部分の認識結果のテキスト(“これはサンプル電子ド+ュメント”)からコピーし編集することで、その文字列を挿入し、要約情報を完成することが可能である。
またレイアウト編集ウィンドウ内の文字コードと要約情報表示ウィンドウ内の文字コードはリンクしているので、空行1405に文字を挿入すると、対応するレイアウト付き文字描画領域である1406部分にも文字が挿入される。なお、レイアウト編集ウィンドウ内の文字列は背景画像に隠れているのでそのままでは見えない。しかしながら、この文字の描画領域を背景やベクトル描画データの描画領域よりも前面になるような操作を加えることで、入力された文字列が、原画像から抽出された文字レイアウト情報、すなわち位置や大きさなどを備えた状態で利用可能になる。
以上説明したように、本実施形態の画像処理装置は、レイアウト付き文字描画データを文字認識率によって出力形態を変えて保存した電子データを生成する。このように生成された電子データに対し、表示・編集プログラム121は、レイアウト編集ウィンドウ上では文字認識率の低い文字情報をあえてユーザに提供せず編集可能な空行を提示するため、ユーザは修正作業や画像の復元が容易になる。すなわち本実施形態では、文字認識率の低いデータを修正しやすい状態での提供が可能である。
なお、表示・編集プログラム121がパワーポイントの場合、レイアウト編集ウィンドウ602はスライドペイン、テキスト編集ウィンドウ603はノートペイン、要約情報表示ウィンドウ604はアウトラインペインである。この場合、文字認識結果の類似度が高い文字列がアウトラインペインに表示され、類似度が低い文字領域が空行でアウトラインペインに表示されるように、レイアウト編集用データ部分にデータを記述した電子ドキュメントを生成する。
以上、本発明の諸実施形態について説明した。
なお、本発明の目的は、上述した実施形態で示したフローチャートの手順を実現するプログラムコードを記憶した記憶媒体から、システムあるいは装置のコンピュータ(またはCPUやMPU)がそのプログラムコードを読出し実行することによっても達成される。
この場合、記憶媒体から読み出されたプログラムコード自体が、コンピュータに、上述した実施形態の機能を実現させることになる。そのため、このプログラムコード及びプログラムコードを記憶/記録したコンピュータ読み取り可能な記憶媒体も本発明の一つを構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
また、前述した実施形態の機能は、コンピュータが、読み出したプログラムを実行することによって実現される。また、このプログラムの実行とは、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行う場合も含まれる。
さらに、前述した実施形態の機能は、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットによっても実現することもできる。この場合、まず、記憶媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行う。こうした機能拡張ボードや機能拡張ユニットによる処理によっても前述した実施形態の機能が実現される。
本発明の第1の実施形態におけるシステム構成の一例を示す図である。 同実施形態1における画像処理装置の電子ドキュメント生成に係る構成と入出力されるデータを説明する図である。 同実施形態1において説明に用いる入力画像を示す図である。 同実施形態1においてデータの格納先を決定するために用いる決定規則を示す図である。 同実施形態1において、図3の入力画像に対して生成される電子ドキュメントの具体例を示す図である。 同実施形態1における表示・編集プログラムに図5の電子ドキュメントを入力した場合の表示例を示す図である。 実施形態1と同様のシステム構成で実施される、本発明の第2の実施形態における画像処理装置の電子ドキュメント生成に係る構成と入出力されるデータを説明する図である。 同実施形態2において説明に用いる入力画像を示す図である。 同実施形態2においてデータの格納先を決定するために用いる決定規則を示す図である。 同実施形態2において、図8の入力画像に対して生成される電子ドキュメントの具体例を示す図である。 同実施形態2における表示・編集プログラムに図10の電子ドキュメントを入力した場合の表示例を示す図である。 本発明の第3の実施形態においてデータの格納先を決定するために用いる決定規則を示す図である。 同実施形態3において、図8の入力画像に対して生成された電子ドキュメントの具体例を示す図である。 同実施形態3における表示・編集プログラムに図13の電子ドキュメントを入力した場合の表示例を示す図である。
符号の説明
100 画像処理装置
101 スキャナ
102 CPU
103 メモリ
104 ハードディスク
105 ネットワークI/F
110 ネットワーク
120 パーソナルコンピュータ
121 表示・編集プログラム
122 再利用プログラム
200 入力画像
210 電子ドキュメント生成部(電子ドキュメント生成プログラム)
211 解析部
212 文字認識部
213 ベクトル化部
214 格納先決定部
215 フォーマット変換部
220 電子ドキュメント
221 レイアウト編集用データ
222 テキスト編集用データ
223 ベクトル描画データ
224 文字コードデータ

Claims (9)

  1. 画像を解析し文字領域を抽出する解析手段と、
    前記解析手段で得られた文字領域について文字認識を行い認識結果の文字コードデータを得る文字認識手段と、
    前記解析手段で得られた文字領域についてベクトル化を行い、ベクトル描画データを得るベクトル化手段と、
    前記文字認識手段で得られた文字コードデータと前記ベクトル化手段で得られたベクトル描画データとについて、電子ドキュメント内の格納先を決定する決定手段と、
    前記文字コードデータおよび前記ベクトル描画データを前記決定手段で決定された格納先に格納した電子ドキュメントを生成する電子ドキュメント生成手段と
    を備えることを特徴とする画像処理装置。
  2. 前記決定手段は、前記ベクトル描画データの格納先を前記電子ドキュメント内のレイアウト編集用データの領域に、かつ、前記文字コードデータの格納先を前記電子ドキュメント内のテキスト編集用データの領域に決定することを特徴とする請求項1に記載の画像処理装置。
  3. 前記解析手段で得られた文字領域について、更に文字レイアウト情報を抽出する文字レイアウト抽出手段を備え、
    前記決定手段は、前記ベクトル描画データの格納先を前記電子ドキュメント内のレイアウト編集用データの領域に、かつ、前記文字レイアウト抽出手段により抽出した文字レイアウト情報と前記文字コードデータとを組み合わせたレイアウト付き文字描画データの格納先を前記電子ドキュメント内のレイアウト編集用データの領域に、かつ、前記文字コードデータの格納先を前記電子ドキュメント内のテキスト編集用データの領域に決定することを特徴とする請求項1に記載の画像処理装置。
  4. 前記決定手段は、更に、文字認識率が高ければ前記レイアウト付き文字描画データを前記電子ドキュメント内の要約表示用のレイアウト編集用データの領域に、文字認識率が低ければ前記レイアウト付き文字描画データを前記電子ドキュメント内の非要約表示用のレイアウト編集用データの領域に分けて格納先を決定することを特徴とする請求項3に記載の画像処理装置。
  5. 前記決定手段は、文字認識率が低いレイアウト付き文字描画データに対して、文字コードデータを削除した文字レイアウト情報のみのデータにしたうえで格納先を前記電子ドキュメント内の要約表示用のレイアウト編集用データの領域に決定することを特徴とする請求項3記載の画像処理装置。
  6. 前記電子ドキュメントのフォーマットは、パワーポイントのフォーマットであることを特徴とする請求項1乃至5のいずれかに記載の画像処理装置。
  7. 画像処理装置によって実行される画像処理方法であって、
    画像を解析し文字領域を抽出する解析ステップと、
    前記解析ステップで得られた文字領域について文字認識を行い認識結果の文字コードデータを得る文字認識ステップと、
    前記解析ステップで得られた文字領域についてベクトル化を行い、ベクトル描画データを得るベクトル化ステップと、
    前記文字認識ステップで得られた文字コードデータと前記ベクトル化ステップで得られたベクトル描画データとについて、電子ドキュメント内の格納先を決定する決定ステップと、
    前記文字コードデータおよび前記ベクトル描画データを前記決定ステップで決定された格納先に格納した電子ドキュメントを生成する電子ドキュメント生成ステップと
    を含むことを特徴とする画像処理方法。
  8. 請求項7に記載の方法をコンピュータに実行させるためのプログラム。
  9. 請求項8に記載のプログラムを記憶させたコンピュータ読み取り可能な記憶媒体。
JP2008171178A 2008-06-30 2008-06-30 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 Active JP5121599B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008171178A JP5121599B2 (ja) 2008-06-30 2008-06-30 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
US12/486,245 US8571359B2 (en) 2008-06-30 2009-06-17 Image processing device, method and storage medium for storing and displaying an electronic document
US14/034,723 US8965125B2 (en) 2008-06-30 2013-09-24 Image processing device, method and storage medium for storing and displaying an electronic document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008171178A JP5121599B2 (ja) 2008-06-30 2008-06-30 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体

Publications (3)

Publication Number Publication Date
JP2010009509A true JP2010009509A (ja) 2010-01-14
JP2010009509A5 JP2010009509A5 (ja) 2011-08-11
JP5121599B2 JP5121599B2 (ja) 2013-01-16

Family

ID=41447521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008171178A Active JP5121599B2 (ja) 2008-06-30 2008-06-30 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体

Country Status (2)

Country Link
US (2) US8571359B2 (ja)
JP (1) JP5121599B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5361574B2 (ja) * 2009-07-01 2013-12-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP5662675B2 (ja) * 2009-12-04 2015-02-04 キヤノン株式会社 画像形成装置及びその制御方法
JP5511450B2 (ja) * 2010-03-16 2014-06-04 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP5733907B2 (ja) 2010-04-07 2015-06-10 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP5576754B2 (ja) 2010-09-29 2014-08-20 キヤノン株式会社 放射線撮像装置
JP6370080B2 (ja) * 2014-04-02 2018-08-08 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム。
US20190155883A1 (en) * 2016-05-18 2019-05-23 Nokia Technologies Oy Apparatus, method and computer program product for recovering editable slide
CN111753814B (zh) * 2019-03-26 2023-07-25 杭州海康威视数字技术股份有限公司 样本生成方法、装置及设备
CN110210564B (zh) * 2019-05-30 2020-07-24 贝壳找房(北京)科技有限公司 相似户型检测方法及装置
WO2021075995A1 (ru) * 2019-10-16 2021-04-22 Общество С Ограниченной Ответственностью "Сарафан Технологии" Способ формирования поисковой выдачи в рекламном виджите
CN111160265B (zh) * 2019-12-30 2023-01-10 Oppo(重庆)智能科技有限公司 文件转换方法、装置、存储介质及电子设备
JP2021149439A (ja) * 2020-03-18 2021-09-27 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
CN112183458B (zh) * 2020-10-19 2023-07-28 万汇链智能科技(苏州)有限公司 一种基于人工智能技术的电子单证的数据处理系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006155380A (ja) * 2004-11-30 2006-06-15 Canon Inc 画像処理装置、その方法およびその制御方法
JP2008092419A (ja) * 2006-10-04 2008-04-17 Canon Inc 画像処理装置、画像処理方法

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0326592A (ja) 1989-06-23 1991-02-05 Nippon Zeon Co Ltd 顕色シート用塗工組成物及び顕色シート
JP3026592B2 (ja) * 1990-10-22 2000-03-27 キヤノン株式会社 輪郭抽出方法及びその装置
JP2979109B2 (ja) * 1992-12-03 1999-11-15 日本アイ・ビー・エム 株式会社 認識文字の情報作成方法及び装置
JP3504054B2 (ja) 1995-07-17 2004-03-08 株式会社東芝 文書処理装置および文書処理方法
JPH11167532A (ja) 1997-12-02 1999-06-22 Canon Inc データ加工システムおよび装置、データ加工方法、記録媒体
JP4366011B2 (ja) * 2000-12-21 2009-11-18 キヤノン株式会社 文書処理装置及び方法
JP4100885B2 (ja) * 2001-07-11 2008-06-11 キヤノン株式会社 帳票認識装置、方法、プログラムおよび記憶媒体
GB0225789D0 (en) * 2002-03-25 2002-12-11 Makemyphone Ltd Method and apparatus for creating image production file for a custom imprinted article
JP3950777B2 (ja) * 2002-09-30 2007-08-01 キヤノン株式会社 画像処理方法、画像処理装置および画像処理プログラム
JP4093084B2 (ja) * 2003-03-12 2008-05-28 セイコーエプソン株式会社 印刷ジョブ作成装置および印刷ジョブ作成方法並びにこれらに用いるプログラム
JP2004310213A (ja) * 2003-04-02 2004-11-04 Seiko Epson Corp 印刷管理システムおよびこれに用いられるプログラム並びに印刷管理方法
JP4350414B2 (ja) * 2003-04-30 2009-10-21 キヤノン株式会社 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
US7363581B2 (en) * 2003-08-12 2008-04-22 Accenture Global Services Gmbh Presentation generator
DE60311805T2 (de) * 2003-08-28 2007-11-22 Accenture Global Services Gmbh Erfassung, Zusammenstellung und/oder Visualisierung von strukturellen Merkmalen von Architekturen
JP4393161B2 (ja) * 2003-11-20 2010-01-06 キヤノン株式会社 画像処理装置及び画像処理方法
JP4371911B2 (ja) 2004-05-31 2009-11-25 キヤノン株式会社 関数化処理方法及び関数化処理装置
US7873218B2 (en) * 2004-04-26 2011-01-18 Canon Kabushiki Kaisha Function approximation processing method and image processing method
US20050273711A1 (en) * 2004-06-04 2005-12-08 Herzman Diane M System and method for preparing distributable multimedia presentations
JP2006018522A (ja) * 2004-06-30 2006-01-19 Canon Inc 画像編集システム及び方法並びにプログラム
JP4646797B2 (ja) * 2005-02-01 2011-03-09 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US8566711B1 (en) * 2005-11-14 2013-10-22 Adobe Systems Incorporated Document views
US8009309B2 (en) * 2005-12-01 2011-08-30 Xerox Corporation Method and system for identifying print jobs associated with an image formation device
US20070133031A1 (en) * 2005-12-08 2007-06-14 Canon Kabushiki Kaisha Image processing apparatus and image processing method
US7460710B2 (en) * 2006-03-29 2008-12-02 Amazon Technologies, Inc. Converting digital images containing text to token-based files for rendering
JP4764231B2 (ja) 2006-03-31 2011-08-31 キヤノン株式会社 画像処理装置、制御方法、コンピュータプログラム
EP1843276A1 (en) * 2006-04-03 2007-10-10 Océ-Technologies B.V. Method for automated processing of hard copy text documents
JP4783235B2 (ja) * 2006-08-09 2011-09-28 株式会社日立製作所 Hmi開発支援装置、hmi開発支援方法およびプログラム
US20090086275A1 (en) * 2007-09-28 2009-04-02 Jian Liang Processing a digital image of content

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006155380A (ja) * 2004-11-30 2006-06-15 Canon Inc 画像処理装置、その方法およびその制御方法
JP2008092419A (ja) * 2006-10-04 2008-04-17 Canon Inc 画像処理装置、画像処理方法

Also Published As

Publication number Publication date
US8571359B2 (en) 2013-10-29
US20090324080A1 (en) 2009-12-31
US20140023272A1 (en) 2014-01-23
US8965125B2 (en) 2015-02-24
JP5121599B2 (ja) 2013-01-16

Similar Documents

Publication Publication Date Title
JP5121599B2 (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
JP5111268B2 (ja) 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
KR101334483B1 (ko) 문서를 디지털화하는 장치 및 방법과, 컴퓨터 판독가능 기록 매체
JP5623079B2 (ja) ハード・コピーの書式からの書式定義の自動発生
US8428356B2 (en) Image processing device and image processing method for generating electronic document with a table line determination portion
JP2011165187A (ja) ドキュメントを表示する方法およびシステム
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JPH08305803A (ja) 文字テンプレートセット学習マシン動作方法
JP4539756B2 (ja) 画像処理装置及び画像処理プログラム
US20090274369A1 (en) Image processing device, image processing method, program, and storage medium
JP5020698B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム
US11146705B2 (en) Character recognition device, method of generating document file, and storage medium
JP5111242B2 (ja) 画像処理装置及び方法
JP4924990B2 (ja) 文書処理装置および文書処理プログラム
JP5159588B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP5673277B2 (ja) 画像処理装置およびプログラム
JP7497620B2 (ja) 文書データ生成装置、画像形成装置、及び文書データ生成プログラム
JP4651407B2 (ja) 画像処理装置およびコンピュータプログラムおよび記憶媒体
JP5343584B2 (ja) 情報処理装置及びプログラム
JP7150809B2 (ja) 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム
JP2007299321A (ja) 情報処理装置、情報処理方法、情報処理プログラム、及び、情報記憶媒体
JP2010026986A (ja) 画像形成装置
JP2009111984A (ja) 情報処理装置及び情報処理方法、並びに、コンピュータプログラム及びコンピュータ可読記録媒体

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20101106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110628

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110628

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120925

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121023

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151102

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5121599

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151102

Year of fee payment: 3