JP2009223363A - 文書処理装置および文書処理プログラム - Google Patents

文書処理装置および文書処理プログラム Download PDF

Info

Publication number
JP2009223363A
JP2009223363A JP2008063855A JP2008063855A JP2009223363A JP 2009223363 A JP2009223363 A JP 2009223363A JP 2008063855 A JP2008063855 A JP 2008063855A JP 2008063855 A JP2008063855 A JP 2008063855A JP 2009223363 A JP2009223363 A JP 2009223363A
Authority
JP
Japan
Prior art keywords
font
character string
size
character
information acquisition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008063855A
Other languages
English (en)
Other versions
JP4924990B2 (ja
Inventor
Nobutaka Kato
伸隆 加藤
Masashi Kaneko
昌史 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2008063855A priority Critical patent/JP4924990B2/ja
Publication of JP2009223363A publication Critical patent/JP2009223363A/ja
Application granted granted Critical
Publication of JP4924990B2 publication Critical patent/JP4924990B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】イメージレイヤとテキストレイヤとが重なる構成の電子文書を生成または出力する際に、各レイヤの間での文字の位置ずれを抑制する。
【解決手段】所定単位の文字列毎に当該文字列のイメージレイヤにおける描画領域に関する位置情報を取得する領域情報取得手段5aと、前記文字列を構成する各文字についてテキストレイヤで使用されるフォントのメトリクス情報を取得するフォント情報取得手段5bと、前記位置情報から特定される描画領域の大きさと前記メトリクス情報から特定されるフォントの大きさとの比率を算出する描画計算手段5cと、前記描画計算手段5cでの算出結果に基づいて前記描画領域の大きさと前記フォントの大きさとが合うように当該フォントの大きさを変倍して前記テキストレイヤについての描画を行う描画処理手段5dと、を備えて文書処理装置を構成する。
【選択図】図1

Description

本発明は、文書処理装置および文書処理プログラムに関する。
近年、スキャンした紙文書から検索可能な電子文書を生成する、といったことが行われている。検索可能な電子文書としては、サーチャブルXPS(XML Paper Specification)と呼ばれるものや、サーチャブルPDF(Portable Document Format)またはテキスト付PDFと呼ばれるもの等が知られている。これらの電子文書は、イメージレイヤとテキストレイヤとが重なるように構成されており、背景となる文書画像がイメージレイヤに表示され、その上層側のテキストレイヤに透明の検索用文字がレイアウトされるようになっている。
また、スキャンした文字データについては、置き換え文字用のアウトラインフォントを用意しておき、操作者の判断および操作に基づいて、スキャンした文字と同等のサイズに変倍したアウトラインフォントに置き換えることが提案されている(例えば、特許文献1参照。)。
特開平5−12402号公報
ところで、上述した検索可能な電子文書では、イメージレイヤとテキストレイヤとが重なる構成のため、当該イメージレイヤに表示される文書画像における文字と、当該テキストレイヤに配される検索用の文字との位置が合致していないと、当該電子文書についての検索を実施した場合に、その検索によって抽出された文字列が文書中のどこに存在しているか正しく特定できないといったことが起こり得る。特に、テキストレイヤで用いるフォントデータの種類によっては、同じポイント数であっても文字幅や文字間距離等が相違することもあるため、イメージレイヤとテキストレイヤとの間で、想定されていなかった文字の位置ずれが生じてしまうことが考えられる。
ここで、図5(a)に示す「Abc Def」という文字列を例に挙げて考える。この「Abc Def」という文字列について、図5(b)に示すように、イメージレイヤにおける文字(図中における黒色文字参照)と、テキストレイヤにおける文字(図中における灰色文字参照)とは、それぞれの位置が必ずしも合致するとは限らず、それぞれの間にずれが生じてしまうことが考えられる。そして、例えばイメージレイヤにおける文字よりテキストレイヤにおける文字のほうが大きくなるようなずれが生じていると、文書出力を行うビューワによっては、図5(c)に示すように、「Abc」についてのハイライト表示部分が「Def」についてのハイライト表示部分に被ってしまう、いわゆる文字被りが発生してしまうおそれがある。つまり、イメージレイヤとテキストレイヤとの間で文字の位置ずれが生じていると、テキスト検索が可能であっても、その検索結果についての文字選択がし辛かったり、文字位置特定がし難くなったりするおそれがある。
この点については、上記特許文献1に開示されているようにフォント置き換えの際に文字毎にサイズ変倍を行うようにしても、必ずしも解消し得るとは限らない。文字毎のサイズ変倍では、文字列を構成する各文字が固定ピッチとなるため、当該文字列の先頭と後尾の位置が合っても一文字毎の位置ずれが発生し得るからであり、また文字列内でフォント種類やポイント数が異なるものに認識される可能性があり、結果として文字列全体としてのバランスが崩れて見栄えが悪くなることもあり得るからである。さらに、上記特許文献1に開示された技術では、操作者の判断および操作を必要とするため、当該操作者、すなわち電子文書の利用者が煩わしさを感じてしまうことも考えられる。
そこで、本発明は、イメージレイヤとテキストレイヤとが重なる構成の電子文書について、これを生成または画像出力する際に、イメージレイヤとテキストレイヤとの間での文字の位置ずれを抑制する文書処理装置および文書処理プログラムを提供することを目的とする。
請求項1に係る発明は、イメージレイヤとテキストレイヤとが重なる構成の電子文書について、当該電子文書における所定単位の文字列毎に、当該文字列の前記イメージレイヤにおける描画領域に関する位置情報を取得する領域情報取得手段と、前記文字列を構成する各文字について、前記テキストレイヤで使用されるフォントのメトリクス情報を取得するフォント情報取得手段と、前記領域情報取得手段での情報取得結果から特定される前記文字列の描画領域の大きさと前記フォント情報取得手段での情報取得結果から特定される当該文字列のフォントの大きさとの比率を算出する描画計算手段と、前記描画計算手段での算出結果に基づいて、前記文字列の描画領域の大きさと当該文字列のフォントの大きさとが合うように、当該フォントの大きさを変倍して前記テキストレイヤについての描画を行う描画処理手段とを備えることを特徴とする文書処理装置である。
請求項2に係る発明は、コンピュータを、イメージレイヤとテキストレイヤとが重なる構成の電子文書について、当該電子文書における所定単位の文字列毎に、当該文字列の前記イメージレイヤにおける描画領域に関する位置情報を取得する領域情報取得手段と、前記文字列を構成する各文字について、前記テキストレイヤで使用されるフォントのメトリクス情報を取得するフォント情報取得手段と、前記領域情報取得手段での情報取得結果から特定される前記文字列の描画領域の大きさと前記フォント情報取得手段での情報取得結果から特定される当該文字列のフォントの大きさとの比率を算出する描画計算手段と、前記描画計算手段での算出結果に基づいて、前記文字列の描画領域の大きさと当該文字列のフォントの大きさとが合うように、当該フォントの大きさを変倍して前記テキストレイヤについての描画を行う描画処理手段として機能させることを特徴とする文書処理プログラムである。
請求項1,2に係る発明によれば、利用者の判断や操作等を必要とすることなく、またテキストレイヤで使用されるフォント種類にもよらずに、所定単位の文字列について、イメージレイヤにおける文字とテキストレイヤにおける文字との描画位置および大きさを合わせることができ、当該イメージレイヤと当該テキストレイヤとが重なる構成の電子文書の閲覧や検索等をする利用者にとっての利便性向上に貢献することが可能となる。さらには、例えば外国語文(特に、アルファベットにより記述される英文)のように文字毎に字幅や文字間距離等が異なるフォント(プロポーショナルフォント)を用いた場合について、一文字毎の位置ずれ調整をする場合に比べて、文字列のバランスを崩すことなく見栄えの良いものとすることができる。
以下、図面に基づき本発明に係る文書処理装置および文書処理プログラムについて説明する。
先ず、文書処理装置の機能構成例について説明する。ここで例に挙げて説明する文書処理装置は、スキャンした紙文書から、検索可能な電子文書、すなわちイメージレイヤとテキストレイヤとが重なる構成の電子文書を生成するものである。このような文書処理装置としては、スキャン機能およびデータ処理機能を有したデジタル複写機、当該複写機としての機能に他装置(プリンタ装置やファクシミリ装置等)としての機能を統合したもの、スキャナ装置に接続して用いられるコンピュータ装置等が挙げられる。
図1は、本発明に係る文書処理装置の機能構成例を示すブロック図である。
図例の文書処理装置は、画像入力部1と、設定部2と、画像処理部3と、蓄積部4と、描画処理部5と、データ転送部6と、を備えて構成されている。
画像入力部1は、例えばスキャナ装置としての機能によって実現されるもので、原稿となる紙文書に対するスキャンを行って、当該紙文書からの画像データの読み取りを行うものである。
設定部2は、例えば文書処理装置の利用者が操作するユーザインタフェースパネルによって実現されるもので、当該利用者が、画像入力部1での画像データの読み取りや画像処理部3での画像データの処理に必要となるパラメータ設定を行うためのものである。
画像処理部3は、所定プログラムを実行するコンピュータ装置としての機能によって実現されるもので、画像入力部1が読み取った画像データに対して、所定の画像処理を行うものである。
画像処理部3が行う画像処理としては、その一つに、画像データに対する文字認識(Optical Character Reader、以下「OCR」と略す。)処理がある。すなわち、画像処理部3は、文字認識手段3aとしての機能を備えている。この文字認識手段3aは、画像処理部3が所定プログラム(例えば、OCR用ソフトウエア)を実行することによって実現されるものである。
なお、文字認識手段3aが行うOCR処理の手法については、公知技術を利用すればよいため、ここではその詳細な説明を省略する。
また、画像処理部3が行うOCR処理以外の画像処理についても、公知技術を利用したものであればよく、ここではその詳細な説明を省略する。
蓄積部4は、例えばハードディスク装置といった記憶装置によって実現されるもので、各種情報の記憶蓄積を行うものである。
この蓄積部4が記憶蓄積する各種情報としては、例えば画像入力部1が読み取った画像データまたは画像処理部3での画像処理後の画像データが挙げられる。また、文字認識手段3aによる文字認識結果に関する情報についても、ここでいう各種情報に含まれる。
さらには、文書処理装置を機能させるために必要となる所定プログラムや、文書画像を作成する上で必要となるフォントデータ4a等も、ここでいう各種情報に含まれるものとする。すなわち、蓄積部4は、フォントデータ4aを記憶蓄積しているものとする。
なお、ここでいうフォントデータ4aは、フォントそのものを特定するデータの他に、当該フォントのメトリクス(メトリック)情報をも含む。メトリクス情報とは、フォントが占めるスペースの大きさを定義する情報で、カーニング情報も含まれる。
描画処理部5は、所定プログラムを実行するコンピュータ装置としての機能によって実現されるもので、画像入力部1での画像読み取り結果や画像処理部3での画像処理結果等を用いて、イメージレイヤとテキストレイヤとが重なる構成の電子文書の生成を行うものである。
ただし、描画処理部5は、電子文書の生成を行うために、領域情報取得手段5a、フォント情報取得手段5b、描画計算手段5cおよび描画処理手段5dとしての機能を備えている。
領域情報取得手段5aは、生成すべき電子文書における所定単位の文字列毎に、当該文字列のイメージレイヤにおける描画領域に関する位置情報を取得するものである。位置情報は、詳細を後述するように、画像処理部3の文字認識手段3aから取得することが考えられる。また、文字列の所定単位としては、文字認識手段3aでの文字認識結果から特定される単語単位とすることが考えられるが、必ずしも単語単位である必要はなく、文字認識手段3aでの文字認識結果から特定される文節単位や行単位等といった他の単位であっても構わない。
フォント情報取得手段5bは、所定単位の文字列を構成する各文字について、テキストレイヤで使用されるフォントのメトリクス情報を取得するものである。メトリクス情報の取得は、蓄積部4のフォントデータ4aにアクセスすることによって行うことが考えられる。
描画計算手段5cは、領域情報取得手段5aでの情報取得結果から特定される文字列の描画領域の大きさと、フォント情報取得手段5bでの情報取得結果から特定される当該文字列のフォントの大きさとについて、これらの比率を算出するものである。
描画処理手段5dは、電子文書生成のための描画処理を行うものである。ただし、描画処理手段5dでは、描画計算手段5cでの算出結果に基づいて、所定単位の文字列の描画領域の大きさと当該文字列のフォントの大きさとが合うように、当該フォントの大きさを変倍して、テキストレイヤについての描画を行うようになっている。
なお、描画処理部5が生成する電子文書は、イメージレイヤとテキストレイヤとが重なる構成のものであれば、そのデータフォーマットが特に限定されることはなく、例えばサーチャブルXPSに準拠したものであってもよいし、サーチャブルPDFに準拠したものであってもよいし、あるいはこれら以外のデータフォーマットに準拠したものであってもよい。
データ転送部6は、描画処理部5が生成した電子文書について、これをその出力先である外部装置に対して転送するものである。外部装置としては、電子文書の表示出力を行う表示装置、当該電子文書の印刷出力を行う印刷装置、当該電子文書を記憶蓄積するファイルサーバ表示装置等が挙げられるが、特に限定されるものではない。また、当該外部装置への電子文書の転送については、公知のデータ転送技術を用いればよいため、ここでその詳細な説明を省略する。
以上のような構成の文書処理装置において、特に描画処理部5が備える各手段5a〜5dは、当該文書処理装置におけるコンピュータとしての機能が、所定プログラムを実行することによって実現されるものとする。つまり、の文書処理装置は、所定プログラムを実行するCPU(Central Processing Unit)や当該所定プログラムを記憶する記憶装置等を備え、当該所定プログラムの実行によって種々の機能を実現し得るように構成されており、このような文書処理装置上で実現される上述の各手段5a〜5dは、当該文書処理装置にインストールされた所定プログラム(文書処理プログラム)によって実現されるものとする。なお、当該文書処理プログラムは、文書処理装置へのインストールに先立ち、コンピュータ読み取り可能な記憶媒体に格納されて提供されるものであっても、または通信回線を介して外部から配信されるものであってもよい。
次に、以上のように構成された文書処理装置における処理動作例について説明する。
図2は、本発明に係る文書処理装置の処理動作例を示すフローチャートである。
上述した構成の文書処理装置では、電子文書を生成するのにあたり、先ず、当該文書処理装置の利用者が当該電子文書の基(原稿)となる紙文書を用意して、当該紙文書を画像入力部1にセットするとともに、設定部2でのパラメータ設定を行い、その後にスタートボタン押下等による動作開始指示を行う(ステップ01、以下ステップを「S」と略す。)。利用者による動作開始指示があると、文書処理装置では、設定部2で設定されたパラメータ(カラー/白黒の別や解像度の指定等)に従いつつ、画像入力部1がセットされた紙文書からの画像データの読み取りを当該紙文書の各ページについて行い(S02)、そのページ毎の画像データに対して画像処理部3が所定の画像処理(解像度変換や色補正等)を行い(S03)、さらに蓄積部4が画像処理後の画像データの記憶蓄積を行う(S04)。そして、原稿となる紙文書の全ページについての処理が終了するまで(S05)、上述した一連の処理を繰り返し行う(S02〜S05)。
その後、文書処理装置では、蓄積部4が記憶蓄積している画像データ(すなわち、イメージレイヤに表示される文書画像を特定する画像データ)について、当該画像データにはテキスト(文字)部分とイメージ(画像)部分との両方が含まれている場合があることから、OCR処理として、画像処理部3が、1ページ分毎に、テキスト部分とイメージ部分との分離を行う。そして、テキスト部分については、文字認識手段3aがOCR処理を行う(S06)。テキスト/イメージ分離処理およびOCR処理の手法は、いずれも、公知技術を利用すればよい。
このOCR処理によって、文字認識手段3aは、テキスト部分を構成する文字列を、所定単位である単語単位で、抽出することになる。ここでは、所定単位が単語単位である場合を例に挙げるが、当該所定単位は、予め設定されているものであれば、既に述べたように、文節単位や行単位等であっても構わない。なお、ここで例に挙げる「単語」とは、それぞれ意味をもって文節を構成する一つ一つの言葉のことである。
さらに、このOCR処理によって、文字認識手段3aは、単語単位での文字列の抽出に併せて、当該文字列の描画領域に関する位置情報をも、抽出することになる。文字列の描画領域に関する位置情報とは、画像1ページ分上にて当該文字列を描画すべき領域の大きさを特定するための情報のことをいい、具体的には当該文字列が属する矩形領域の左上座標値および右下座標値からなる情報が挙げられる。ただし、当該文字列の描画領域の大きさを特定し得るものであれば、必ずしも矩形領域の左上座標値および右下座標値からなる情報に限定されることはなく、他の情報(例えば、左下座標値および領域幅の値からなる情報)を用いても構わない。
文字認識手段3aでのOCR処理の結果、テキスト部分を構成する文字列が抽出された場合には(S07)、文書処理装置では、続いて、電子文書を構成するテキストレイヤとなる部分の生成のために、描画処理部5が蓄積部4に記憶蓄積されているフォントデータ4aを用いて当該文字列についての描画処理を行う。このとき、描画処理部5は、単語単位での文字列毎に、以下に述べるような処理を行う。
すなわち、描画処理部5では、描画処理対象となる単語単位の文字列(以下、単に「処理対象文字列」という。)について、領域情報取得手段5aがその描画領域に関する位置情報を文字認識手段3aから取得するとともに、フォント情報取得手段5bが蓄積部4のフォントデータ4aにアクセスして当該処理対象文字列を構成する各文字について使用されるフォントのメトリクス情報を取得する。そして、領域情報取得手段5aが描画領域に関する位置情報を取得し、フォント情報取得手段5bがフォントのメトリクス情報を取得すると、描画計算手段5cが、領域情報取得手段5aでの情報取得結果から特定される処理対象文字列の描画領域の大きさと、フォント情報取得手段5bでの情報取得結果から特定される当該処理対象文字列を構成する各文字のフォントの大きさとについて、これらの比率を算出する(S08)。
このような比率の算出を描画計算手段5cが行うと、描画処理部5では、描画処理手段5dが処理対象文字列を構成する各文字の描画処理を行う。ただし、このとき、描画処理手段5dは、描画計算手段5cでの算出結果に基づいて、当該処理対象文字列の描画領域の大きさと当該処理対象文字列を構成する各文字のフォントの大きさとが合うように、当該フォントの大きさを変倍して、当該各文字の描画を行う(S09)。
描画処理部5では、以上のような処理対象文字列についての描画処理を、文字認識手段3aが抽出した全ての文字列について終了するまで、繰り返し行う(S07〜S09)。なお、描画処理部5による各文字の描画結果(フォント文字画像の展開結果)は、例えば蓄積部4内に確保されたバッファ領域に保存しておくことが考えられる。
全ての文字列についての描画処理を終了すると、その後、文書処理装置では、描画処理部5が、当該描画処理の結果と蓄積部4が記憶蓄積している画像データとについて、イメージレイヤとテキストレイヤとが重なる構成の電子文書としてのフォーマット化を行う(S10)。つまり、描画処理部5は、当該描画処理の結果と当該画像データとを基にして、イメージレイヤとテキストレイヤとが重なる構成の電子文書の生成を行うのである。具体的には、例えばサーチャブルXPSに準拠する場合であれば、イメージレイヤに表示される背景となる文書画像データ、その上層側のテキストレイヤに表示される検索用文字、および、その検索用文字として使用されるフォントデータそのものを、それぞれフォーマット化して電子文書の生成を行う。また、例えばサーチャブルPDFに準拠する場合であれば、イメージレイヤに表示される背景となる文書画像データ、および、その上層側のテキストレイヤに表示される検索用文字を、それぞれフォーマット化して電子文書の生成を行う。なお、このときのフォーマット化の手法およびフォーマットそのものについては、公知技術を利用したものであればよく、ここではその詳細な説明を省略する。
そして、描画処理部5が電子文書の生成を行うと、文書処理装置では、データ転送部6が当該電子文書をその出力先である外部装置に対して転送する(S11)。すなわち、データ転送部6は、当該電子文書についてのデータ転送を転送すべきデータがなくなるまで継続的に行い、転送すべきデータがなくなると当該データ転送を完了する。
次に、以上のような一連の処理動作例のうち、描画処理部5が行う処理動作例について、具体例を挙げてさらに詳しく説明する。
図3および図4は、文字描画処理の一具体例を示す説明図である。
例えば、図3(a)に示す「Abc」という文字列を例に挙げて考える。この「Abc」という文字列について、描画処理部5は、図3(b)に示すように、その描画領域に関する位置情報として、当該「Abc」という文字列を描画すべき矩形領域の左上座標値(X0,Y0)および右下座標値(X1,Y1)を取得する。さらには、当該文字列を構成する「A」、「b」および「c」の各文字について使用されるフォントのメトリクス情報として、当該各文字の高さ方向寸法値Hとそれぞれの幅方向寸法値Wa,Wb,Wcを取得する。
ここで、各文字についてのフォントは、蓄積部4が記憶蓄積しているフォントデータ4aが一種類のみであれば、そのフォントデータ4aによるものが使用される。また、蓄積部4が複数種類のフォントデータ4aを記憶蓄積している場合であれば、所定基準に基づいて選択された種類のフォントデータ4aによるものが使用される。なお、所定基準としては、原画像の文字形状との類似度によるものや、予め設定された各種類別の優先度によるもの等を用いることが考えられるが、特に限定されるものではなく、他の公知技術によるものであっても構わない。
ところで、フォントデータ4aの種類によっては、同じポイント数であっても、文字幅や文字間距離等が相違することが知られている。そのため、「A」、「b」および「c」の各文字について使用されるフォントをそのまま描画すると、図3(c)に示すように、電子文書の生成後において、イメージレイヤとテキストレイヤとの間で、想定されていなかった文字の位置ずれが生じてしまうことが考えられる。
このことから、描画処理部5では、図4(a)に示す「Abc」という文字列であれば、当該「Abc」という文字列を描画すべき矩形領域の左上座標値(X0,Y0)および右下座標値(X1,Y1)から、座標値X0と座標値X1との差の絶対値を算出して、当該矩形領域の幅方向の大きさを求める。さらには、「A」、「b」および「c」の各文字の幅方向寸法値Wa,Wb,Wcから、これらの和を算出して、当該各文字のフォント群の幅方向の大きさを求める。そして、図4(b)に示すように、各文字のフォント群の幅方向の大きさ[Wa+Wb+Wc]について、これを矩形領域の幅方向の大きさ|X1−X0|で除して、これらの間の比率Magを算出する。
その後、描画処理部5では、「A」、「b」および「c」の各文字について使用されるそれぞれのフォントに対して、算出した比率Magを変倍率として用いて変倍(拡大または縮小のいずれか)を行って、当該フォントについての描画を行う。つまり、描画処理部5は、図4(c)に示すように、「Abc」という文字列の描画領域の大きさ|X1−X0|と、変倍後における「A」、「b」および「c」の各文字のフォント群の大きさ[Wa*Mag+Wb*Mag+Wc*Mag]とが合うように、各フォントの大きさを変倍して、当該「A」、「b」および「c」の各文字の描画を行うのである。
なお、ここでは、各文字の幅方向寸法のみを変倍の対象とし、各文字の高さ方向寸法値Hについては変倍の対象としていないが、当該高さ方向寸法値Hについても変倍の対象としても構わない。すなわち、高さ方向寸法値Hを矩形領域の高さ方向の大きさ|Y0−Y1|で除して、これらの間の変倍率を求め、その変倍率をフォントの描画に反映させることも考えられる。
以上のような処理手順を経て生成される電子文書は、文書処理装置の利用者による文字変倍のための判断や操作等を必要とすることなく、またテキストレイヤで使用されるフォント種類にもよらずに、所定単位の一例である単語単位の文字列について、イメージレイヤにおける文字とテキストレイヤにおける文字との描画位置および大きさが合致したものとなる。したがって、例えば外国語文(英文、仏文、独文等。特に、アルファベットにより記述される英文。)のように文字毎に字幅や文字間距離等が異なるフォント(プロポーショナルフォント)を用いた場合であっても、一文字毎の位置ずれ調整をする場合に比べて、文字列単位でバランスよく表示できるようになる。
なお、本実施形態では、本発明の好適な実施具体例について説明したが、本発明はその内容に限定されるものではない。
例えば、本実施形態では、電子文書の生成を行う場合を例に挙げて説明したが、電子文書の画像出力を行う場合についても、全く同様に本発明を適用することが考えられる。すなわち、イメージレイヤとテキストレイヤとが重なる構成の電子文書につき、その表示出力または印刷出力を行う文書処理装置または文書処理プログラムにおいて、当該表示出力または当該印刷出力のための出力データを生成するのにあたり、本実施形態と同様の手順でフォントの変倍を行えば、出力側デバイスが保持するフォントデータの種類によらずに、イメージレイヤとテキストレイヤとの間で文字の位置ずれが生じてしまうことのない表示出力または印刷出力を行うことが実現可能となる。
このように、本発明は、本実施形態で説明した内容に限定されるものではなく、その要旨を逸脱しない範囲で変更することが可能である。
本発明に係る文書処理装置の機能構成例を示すブロック図である。 本発明に係る文書処理装置の処理動作例を示すフローチャートである。 本発明に係る文書処理装置が行う文字描画処理の一具体例を示す説明図(その1)である。 本発明に係る文書処理装置が行う文字描画処理の一具体例を示す説明図(その2)である。 検索可能な電子文書の一具体例を示す説明図である。
符号の説明
1…画像入力部、2…設定部、3…画像処理部、3a…文字認識手段、4…蓄積部、4a…フォントデータ、5…描画処理部、5a…領域情報取得手段、5b…フォント情報取得手段、5c…描画計算手段、5d…描画処理手段、6…データ転送部

Claims (2)

  1. イメージレイヤとテキストレイヤとが重なる構成の電子文書について、当該電子文書における所定単位の文字列毎に、当該文字列の前記イメージレイヤにおける描画領域に関する位置情報を取得する領域情報取得手段と、
    前記文字列を構成する各文字について、前記テキストレイヤで使用されるフォントのメトリクス情報を取得するフォント情報取得手段と、
    前記領域情報取得手段での情報取得結果から特定される前記文字列の描画領域の大きさと前記フォント情報取得手段での情報取得結果から特定される当該文字列のフォントの大きさとの比率を算出する描画計算手段と、
    前記描画計算手段での算出結果に基づいて、前記文字列の描画領域の大きさと当該文字列のフォントの大きさとが合うように、当該フォントの大きさを変倍して前記テキストレイヤについての描画を行う描画処理手段と
    を備えることを特徴とする文書処理装置。
  2. コンピュータを、
    イメージレイヤとテキストレイヤとが重なる構成の電子文書について、当該電子文書における所定単位の文字列毎に、当該文字列の前記イメージレイヤにおける描画領域に関する位置情報を取得する領域情報取得手段と、
    前記文字列を構成する各文字について、前記テキストレイヤで使用されるフォントのメトリクス情報を取得するフォント情報取得手段と、
    前記領域情報取得手段での情報取得結果から特定される前記文字列の描画領域の大きさと前記フォント情報取得手段での情報取得結果から特定される当該文字列のフォントの大きさとの比率を算出する描画計算手段と、
    前記描画計算手段での算出結果に基づいて、前記文字列の描画領域の大きさと当該文字列のフォントの大きさとが合うように、当該フォントの大きさを変倍して前記テキストレイヤについての描画を行う描画処理手段
    として機能させることを特徴とする文書処理プログラム。
JP2008063855A 2008-03-13 2008-03-13 文書処理装置および文書処理プログラム Expired - Fee Related JP4924990B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008063855A JP4924990B2 (ja) 2008-03-13 2008-03-13 文書処理装置および文書処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008063855A JP4924990B2 (ja) 2008-03-13 2008-03-13 文書処理装置および文書処理プログラム

Publications (2)

Publication Number Publication Date
JP2009223363A true JP2009223363A (ja) 2009-10-01
JP4924990B2 JP4924990B2 (ja) 2012-04-25

Family

ID=41240115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008063855A Expired - Fee Related JP4924990B2 (ja) 2008-03-13 2008-03-13 文書処理装置および文書処理プログラム

Country Status (1)

Country Link
JP (1) JP4924990B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009093319A (ja) * 2007-10-05 2009-04-30 Seiko Epson Corp ファイル生成プログラム、画像処理装置、および画像処理方法
JP2012190461A (ja) * 2011-03-10 2012-10-04 Konica Minolta Laboratory Usa Inc 利用可能な代替フォントの代用時における欠落フォントのフォントメトリックスへの適合
JP2015103114A (ja) * 2013-11-26 2015-06-04 コニカミノルタ株式会社 テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム
JP2016021086A (ja) * 2014-07-11 2016-02-04 コニカミノルタ株式会社 電子文書生成システム、電子文書生成装置およびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08314494A (ja) * 1995-05-19 1996-11-29 Matsushita Electric Ind Co Ltd 情報検索装置
JPH09231207A (ja) * 1996-02-27 1997-09-05 Canon Inc 文字図形作成方法
JP2008059527A (ja) * 2006-09-04 2008-03-13 Ricoh Co Ltd 画像処理装置およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08314494A (ja) * 1995-05-19 1996-11-29 Matsushita Electric Ind Co Ltd 情報検索装置
JPH09231207A (ja) * 1996-02-27 1997-09-05 Canon Inc 文字図形作成方法
JP2008059527A (ja) * 2006-09-04 2008-03-13 Ricoh Co Ltd 画像処理装置およびプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009093319A (ja) * 2007-10-05 2009-04-30 Seiko Epson Corp ファイル生成プログラム、画像処理装置、および画像処理方法
JP2012190461A (ja) * 2011-03-10 2012-10-04 Konica Minolta Laboratory Usa Inc 利用可能な代替フォントの代用時における欠落フォントのフォントメトリックスへの適合
JP2015103114A (ja) * 2013-11-26 2015-06-04 コニカミノルタ株式会社 テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム
JP2016021086A (ja) * 2014-07-11 2016-02-04 コニカミノルタ株式会社 電子文書生成システム、電子文書生成装置およびプログラム
US9398191B2 (en) 2014-07-11 2016-07-19 Konica Minolta, Inc. Electronic document generation system, electronic document generation apparatus, and recording medium
CN105320933B (zh) * 2014-07-11 2019-01-25 柯尼卡美能达株式会社 电子文档生成系统以及电子文档生成装置

Also Published As

Publication number Publication date
JP4924990B2 (ja) 2012-04-25

Similar Documents

Publication Publication Date Title
JP4251629B2 (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
JP5733907B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4405831B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4948586B2 (ja) 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体
JP5121599B2 (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
JP5511450B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
CN101924851B (zh) 图像处理装置及图像处理方法
JP4854491B2 (ja) 画像処理装置及びその制御方法
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JP2011076581A (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
US20200104586A1 (en) Method and system for manual editing of character recognition results
JP2009193356A (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
US9614984B2 (en) Electronic document generation system and recording medium
US20090254813A1 (en) Document processing apparatus and document processing method
JP4956319B2 (ja) 画像処理装置、その制御方法、ならびにそのプログラムおよび記憶媒体
JP4924990B2 (ja) 文書処理装置および文書処理プログラム
JP4232679B2 (ja) 画像形成装置およびプログラム
US8355577B2 (en) Image processing apparatus and method
US8339623B2 (en) Paper document processing apparatus, paper document processing method, and computer readable medium
JP5696394B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2018151699A (ja) 情報処理装置及びプログラム
JP2013152564A (ja) 文書処理装置及び文書処理方法
JP2007052613A (ja) 翻訳装置、翻訳システムおよび翻訳方法
JP6205973B2 (ja) 変更履歴出力装置、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090824

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20091009

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120116

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4924990

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120129

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees