JP4900271B2 - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP4900271B2
JP4900271B2 JP2008031332A JP2008031332A JP4900271B2 JP 4900271 B2 JP4900271 B2 JP 4900271B2 JP 2008031332 A JP2008031332 A JP 2008031332A JP 2008031332 A JP2008031332 A JP 2008031332A JP 4900271 B2 JP4900271 B2 JP 4900271B2
Authority
JP
Japan
Prior art keywords
rectangle
representative value
line
electronic document
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008031332A
Other languages
English (en)
Other versions
JP2009193191A (ja
Inventor
聡 久保田
俊一 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2008031332A priority Critical patent/JP4900271B2/ja
Publication of JP2009193191A publication Critical patent/JP2009193191A/ja
Application granted granted Critical
Publication of JP4900271B2 publication Critical patent/JP4900271B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
電子ドキュメントを記述できる電子ドキュメントフォーマットが存在する。例えば、PDF(Portable Document Format)(登録商標)といわれるものがある。
このような電子ドキュメントでは、PC上で、その電子ドキュメントを表示することが行われる。
そして、その電子ドキュメントに記述されているテキスト情報を、操作者の操作に応じてPC上で選択し、コピー&ペースト等の処理が行われる。テキスト情報をPC上で選択する(例えば、電子ドキュメントを表示しているディスプレイ上に表示されているテキスト位置でマウスを左クリックしながらテキスト位置を右に移動させる等の動作でテキスト情報を選択することができる)場合、選択したテキスト位置が反転して、どのテキストを選択しているかを示すようなビューワが存在している。
一方、画像を文字認識して、電子ドキュメントを生成することも行われている。
これに関連する技術として、例えば、特許文献1には、入力画像より文字もしくは文字の要素に外接する矩形を抽出する矩形抽出手段、該矩形抽出手段により抽出された矩形内の画像に対し、指定可能な複数のモード中より指定されたモードにしたがった変倍処理を施す変倍処理手段、前記矩形抽出手段により抽出された矩形の座標を、指定可能な複数のモード中より指定されたモードにしたがって変換する座標変換手段、及び、前記変倍後の矩形内画像を前記座標変換手段により変換後の座標にしたがって印字位置を制御し印刷する出力手段を具備する文字列整形装置が開示されている。
また、例えば、特許文献2には、認識された文字を、記載されているテキストと文字の大きさや位置等を等しく、アウトフォントで描くことができることを実現することを目的とし、テキストコード情報と文字のレイアウト情報を有する認識文字に関する情報を得る認識手段と、文字のアウトフォントデータを保持するアウトフォントテーブルと、これを参照して、得られた認識文字に外接する矩形を、アウトラインフォントの文字ボックスと描かれる文字部領域との比で拡大し、拡大された外接矩形を文字ボックスデータとして用いて情報を修正する文字ボックス拡大手段と、認識された文字列中の区切りを判定する手段と、当該区切りの間の文字数で文字ボックスの幅を均等に割り付けて得られた幅で拡大された外接矩形からなる文字ボックスデータを修正する手段と、を有し、情報に基づいてアウトフォントにより文字を描いたときに小さくなることを回避し、また、区切られた文字列をまとめて取り扱うことを可能としていることが開示されている。
特開平04−167188号公報 特許平06−176188号公報
ところで、電子文書から画素塊である例えば文字を選択するような場合に、従来技術を用いると、その文字を選択して表示する反転形状が文字毎に個別になり、ラインとして不揃いの反転形状になってしまう。
本発明は、電子文書内の画素塊を囲む矩形の位置及び大きさを揃えて、ラインの形状を整えるようにした情報処理装置及び情報処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、電子文書内の画素塊の矩形に関する情報を用いて、該電子文書内の行又は列であるラインを抽出するライン抽出手段と、前記ライン抽出手段によって抽出されたラインである行の高さ又は該ラインである列の幅に基づいて第1の代表値を算出する第1代表値算出手段と、前記ライン抽出手段によって抽出されたライン内の画素塊間の間隔に基づいて第2の代表値を算出する第2代表値算出手段と、前記第1代表値及び前記第2代表値に基づいて、文字列が選択された場合に、その文字列を囲む反転矩形形状が長方形となるように、文字同士の矩形高さ又は矩形幅が揃い、矩形同士の隙間が空かないように、前記電子文書内の画素塊を囲む矩形の位置及び大きさを算出する矩形算出手段を具備することを特徴とする情報処理装置である。
請求項2の発明は、前記電子文書内の画素塊の矩形に関する情報として、該画素塊の矩形の高さ又は幅方向の位置を含み、前記ライン抽出手段は、該画素塊の矩形の高さ又は幅方向の位置を用いて、該画素塊を含むラインである各行の高さ又は各列の幅を抽出することを特徴とする請求項1に記載の情報処理装置である。
請求項3の発明は、前記第1代表値算出手段は、前記ラインである行の高さ又は列の幅の値における頻度数に基づいて第1の代表値を算出することを特徴とする請求項1又は2に記載の情報処理装置である。
請求項4の発明は、前記第2代表値算出手段は、前記ライン内の画素塊間の間隔における頻度数に基づいて第2の代表値を算出することを特徴とする請求項1から3のいずれか一項に記載の情報処理装置である。
請求項5の発明は、前記矩形算出手段は、前記電子文書内に同等の形状の画素塊がある場合には、該画素塊を囲む矩形の位置及び大きさを同等の値とすることを特徴とする請求項1から4のいずれか一項に記載の情報処理装置である。
請求項6の発明は、前記矩形算出手段は、前記電子文書内の文字の言語に基づいて、前記画素塊を囲む矩形の大きさを算出することを特徴とする請求項1から5のいずれか一項に記載の情報処理装置である。
請求項7の発明は、コンピュータを、電子文書内の画素塊の矩形に関する情報を用いて、該電子文書内の行又は列であるラインを抽出するライン抽出手段と、前記ライン抽出手段によって抽出されたラインである行の高さ又は該ラインである列の幅に基づいて第1の代表値を算出する第1代表値算出手段と、前記ライン抽出手段によって抽出されたライン内の画素塊間の間隔に基づいて第2の代表値を算出する第2代表値算出手段と、前記第1代表値及び前記第2代表値に基づいて、文字列が選択された場合に、その文字列を囲む反転矩形形状が長方形となるように、文字同士の矩形高さ又は矩形幅が揃い、矩形同士の隙間が空かないように、前記電子文書内の画素塊を囲む矩形の位置及び大きさを算出する矩形算出手段として機能させることを特徴とする情報処理プログラムである。
請求項1の情報処理装置によれば、電子文書内の画素塊を囲む矩形の位置及び大きさを揃えて、ラインの形状を整えることができる。
請求項2の情報処理装置によれば、予め定めた値ではなく、その電子文書内のラインに合わせて各行の高さ又は各列の幅を抽出することができる。
請求項3の情報処理装置によれば、予め定めた値ではなく、その電子文書内のラインに合わせて第1の代表値を算出することができる。
請求項4の情報処理装置によれば、予め定めた値ではなく、その電子文書内の画素塊間の間隔に合わせて第2の代表値を算出することができる。
請求項5の情報処理装置によれば、同等の形状の画素塊に対しては、同等の画素塊を囲む矩形とすることができる。
請求項6の情報処理装置によれば、その言語に用いられる文字の特徴に沿った画素塊を囲む矩形の大きさを算出することができる。
請求項7の情報処理プログラムによれば、電子文書内の画素塊を囲む矩形の位置及び大きさを揃えて、ラインの形状を整えることができる。
まず、本実施の形態が対象とする電子ドキュメントについて説明する。
例えば、図9に示す例のように「美しい日本」という文字列が表示されている電子ドキュメント900の「美しい日本」のテキストをPC上で選択すると、図10に示す例のように「美しい日本」の部分が反転して(図10に示す選択テキスト1001)、「美しい日本」が選択されたことをユーザに示すことができる。
あるいは、前述のようにテキストを選択した状態で、PC上でコピー&ペーストを行うと、別のファイル上に「美しい日本」というテキスト情報をコピーすることが可能となる。図11に示す例のように、ワードプロセッサ等のような別のアプリケーションファイル(図11に示す電子ドキュメント1100)上に、テキスト情報をペーストすることができる。
次に、このような電子ドキュメント内の文字形状を指定するため、PDFなどのように、フォント情報を電子ドキュメント内に包含させることができるものがある。電子ドキュメントを表示あるいはプリントする場合に、電子ドキュメントを作成するユーザの意図通りの文字形状を復元するため、電子ドキュメント内にフォント情報(文字形状情報)を埋め込んでしまう。このように電子ドキュメント内にフォント情報を埋め込んでしまうことによって、同じフォント情報を持っていない電子ドキュメントの受け手(プリンタやPC)が、電子ドキュメントの作成者と全く同じ文字形状を復元することができるようになる。
前述したように、電子ドキュメント内の文字形状を指定するためにフォント情報(文字形状情報)を埋め込む際に、電子ドキュメントの受け手(プリンタやPC)のデバイス情報に合せて文字部分の解像度を上げたり、編集や再利用が可能なようにアウトライン化するなどの処理が行われる。ここで文字のアウトライン化とは、文字の輪郭形状をベジエのような曲線で近似して表す方法である。
このように、文字形状を指定するためのフォント情報の文字部分に前述したような画像処理が施された場合に、文字部分の画像処理に応じた適切なフォント情報の更新が行われないと、電子ドキュメントをビューワで閲覧した場合のテキスト情報選択動作の挙動がオリジナルの電子ドキュメントと異なることがある。
例えば図12に示す例のように、「美しい日本」のテキストを選択したことを示す反転矩形形状(図12に示す選択テキスト1201〜1205)が、図10で示した例のように整った長方形の反転矩形形状にはならず、各文字で矩形が独立し、さらにはその大きさも異なる矩形形状となり、反転矩形形状の品質が低下する。これは文字部分の画像処理によりオリジナルのフォント情報に存在した“文字列として選択された場合の形状も考慮した”矩形情報が失われているか、あるいは適切に情報の修正が行われていないことに起因する。
したがって、反転矩形形状を整ったものにするためには、電子ドキュメント内に埋め込む文字矩形情報を適切に修正する必要がある。
本実施の形態によって出力される電子ドキュメントは、フォント情報が埋め込まれており、その文字列を選択した場合における反転矩形形状の品質劣化が抑制されたものである。
次に、本実施の形態の概要について説明する。
本実施の形態では、電子ドキュメントに埋め込まれるフォント情報内の矩形情報の修正を、文字毎の情報にのみ基づくのではなく、その電子ドキュメント全体から矩形情報の修正に必要な情報を抽出又は算出して、それらに基づいて文字毎の矩形の修正を行うものである。
具体的には、横書きの電子ドキュメントの場合は以下のようにする。
(1)電子ドキュメント内の文字外接矩形情報(その電子ドキュメント内の絶対座標値及び矩形サイズ)から行を抽出する。
(2)行の高さとして、すべての文字外接矩形が収まるような最小値を求める。
(3)さらに電子ドキュメント内の文字外接矩形情報から外接矩形間隔を求める。
(4)各行の高さの集合から、矩形高さの代表値を決定する。
(5)各外接矩形間隔の集合から、電子ドキュメント中の文字外接矩形に隙間が生じないように外接矩形間隔の代表値を決定する。
(6)文字外接矩形情報、矩形高さの代表値及び外接矩形間隔の代表値に基づいて文字毎の矩形を修正する。
また、縦書きの電子ドキュメントの場合は以下のようにする。
(1)電子ドキュメント内の文字外接矩形情報(その電子ドキュメント内の絶対座標値及び矩形サイズ)から列を抽出する。
(2)列の幅として、すべての文字外接矩形が収まるような最小値を求める。
(3)さらに電子ドキュメント内の文字外接矩形情報から外接矩形間隔を求める。
(4)各列幅の集合から、矩形幅の代表値を決定する。
(5)各外接矩形間隔の集合から、電子ドキュメント中の文字外接矩形に隙間が生じないように外接矩形間隔の代表値を決定する。
(6)文字外接矩形情報、矩形幅の代表値及び外接矩形間隔の代表値に基づいて文字毎の矩形を修正する。
本実施の形態では、電子ドキュメント内の文字外接矩形情報から、行又は列を抽出し、その抽出した行又は列に基づいて、文字列を選択した場合にでも反転矩形形状が揃うように文字矩形情報の幅又は高さの修正を行い、文字列選択時の反転矩形形状の劣化を抑えるものである。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。
以下、行又は列をラインと称する。また、横書きの電子ドキュメントを対象とした場合を主に説明する。したがって、横書きの場合の行の高さ又は縦書きの場合の列の幅として、行の高さを主に例示して説明する。
また、画素塊とは、4連結又は8連結で連続する画素領域を少なくとも含み、これらの画素領域の集合をも含む。これらの画素領域の集合とは、4連結等で連続した画素領域が複数あり、その複数の画素領域は近傍にあるものをいう。ここで、近傍にあるものとは、例えば、互いの画素領域が距離的に近いもの、文章としての1行から1文字ずつ切り出すように縦又は横方向に射影し、空白地点で切り出した画像領域、又は所定間隔で切り出した画像領域等がある。例えば、文字認識処理を行って、1文字として認識された画像を1つの画素塊としてもよい。
なお、1つの画素塊として、1文字の画像となる場合が多い。以下、画素塊のことを文字又は文字画像ともいう。
本実施の形態は、図1に示すように、ライン認識処理モジュール110、ライン特徴算出モジュール120、代表値算出処理モジュール130、文字情報補正処理モジュール140を有している。
ライン認識処理モジュール110は、ライン特徴算出モジュール120と接続されており、電子ドキュメント内の画素塊の矩形に関する情報を用いて、その電子ドキュメント内の行又は列であるラインを抽出し、その抽出したラインに関する情報をライン特徴算出モジュール120へ渡す。
ライン認識処理モジュール110について、より詳細に説明する。
ライン認識処理モジュール110は、文字情報データを受け付ける。ここでいう文字情報データとは、電子ドキュメント中における文字の絶対座標、文字の大きさを表す外接矩形サイズ(外接矩形幅、高さ)、縦書き文字なのか横書き文字なのかを表す情報などである。
次にライン認識処理モジュール110は、受け付けた文字情報データに基づいて、ラインを抽出する。例えば、外接矩形の高さ方向の位置(x座標)を用いて、その外接矩形を含むラインである各行の高さを抽出する。より詳細な例について、図2に行抽出の手法を示す。
ライン認識処理モジュール110は、図2(a)の例に示すように、注目文字情報データの外接矩形(注目文字矩形212)の左上y座標(upper_y)が、一つ前の文字情報データの外接矩形(注目文字矩形211)の左下y座標(lower_y)より小さいときは(upper_y<lower_y)、その注目文字情報データの外接矩形(注目文字矩形212)は注目文字矩形211と同じ行であると認識する。なお、左上を原点(0,0)としている。
また、図2(b)の例に示すように、注目文字情報データの外接矩形(注目文字矩形222)の左上y座標(upper_y)が、一つ前の文字情報データの外接矩形(注目文字矩形221)の左下y座標(lower_y)より大きいときは(lower_y<upper_y)、異なる行であると認識する。
そして、同じライン内にあると認識された文字情報データの列をライン特徴算出モジュール120へ渡す。
なお、受け付けた文字情報データは、文字画像の外接矩形の出現順(例えば、横書きの場合は、左上から右へ走査し、次の行ではまた左から右へ走査した順番に並んでいる)となっているので、一つ前の文字情報データの外接矩形とは、出現順で一つ前である。また、外接矩形の左上の座標を用いてソートしてもよい。
ライン特徴算出モジュール120は、ライン認識処理モジュール110、代表値算出処理モジュール130と接続されており、行高列幅算出モジュール121、矩形間距離算出モジュール122を有している。ライン認識処理モジュール110により同じラインと認識された文字情報データを受け取り、そのラインに関する特徴を算出し、その算出したラインに関する情報を代表値算出処理モジュール130へ渡す。行高列幅算出モジュール121は行の高さを算出し、矩形間距離算出モジュール122は矩形間の距離を算出する。
つまり、ライン認識処理モジュール110によって同じ行と認識された文字情報データ列から行高さ及び外接矩形間距離などのラインに関する特徴を算出する。
図3の例に示すように、行高列幅算出モジュール121は、行高さhを次のように算出する。同じラインに属する文字情報データ(文字矩形301〜399)の座標値からmax_y、min_yを求める。つまり、そのライン内で、左下座標のy座標内の最大値をmax_y(文字矩形399)とし、左上座標のy座標内の最小値をmin_y(文字矩形303)とする。そして、行高さh = max_y − min_y として求める。なお、max_y、min_yのそれぞれの値も保持する。
また、矩形間距離算出モジュール122は、外接矩形間距離を同じ行に属する隣接する文字情報データの外接矩形間距離g0(文字矩形301と文字矩形302間の距離、以下同様),g1,・・・,gnの平均値として求めてもよいし、またリストデータとしてg0,g1,・・・,gnすべてを保持してもよい。
代表値算出処理モジュール130は、ライン特徴算出モジュール120、文字情報補正処理モジュール140と接続されており、行高列幅代表値算出モジュール131、矩形間距離代表値算出モジュール132を有している。ライン特徴算出モジュール120からラインに関する情報を受け取り、2つの代表値(行の高さと外接矩形間の距離)を算出し、その算出した代表値を文字情報補正処理モジュール140へ渡す。行高列幅代表値算出モジュール131は行の高さの代表値を算出し、矩形間距離代表値算出モジュール132はライン内の矩形間の距離の代表値を算出する。
つまり、代表値算出処理モジュール130は、ライン特徴算出モジュール120で算出された文書中すべての行の特徴(行高さ、外接矩形間距離)から文字情報データの補正に用いる外接矩形の高さの代表値、及びライン内の外接矩形間距離の代表値を算出する。
図4に示す例は、横軸を行高さ、縦軸を同じ行高さを持つ行の本数(頻度数)とした場合のヒストグラムを示したものである。図4の例に示すように、行高列幅算出モジュール121で算出される行高さは、対象としている電子ドキュメント中で用いられる文字の大きさに基づいて分布するため、ヒストグラム中にはある行高さの値を中心とした山ができる。つまり、図4で示す例では3つの山(グループ401〜403)があるため、ドキュメント中に3種類の文字の大きさが使われていることになる。
行高列幅代表値算出モジュール131は、図4の例に示すようなヒストグラムを生成し、ヒストグラムの山(グループ401〜403)を検出して、行高さの代表値(図4の例の場合では、H1、H2、H3)を算出する。それぞれの代表値は、ヒストグラムの各山での最大値を超えるような値とする。また図5の例に示すように、同じ高さを持つ行の本数に対して閾値Thを設けて、その閾値以上で行高さとしてその山における最大の値とするようにしてもよい。つまり、図5に示す例では、行高さの代表値は、H11、H22、H33となる。
また矩形間距離代表値算出モジュール132は、外接矩形間距離に関して前記の行高さの場合と同様に、ヒストグラムを生成し、ヒストグラムの山を検出して、複数の外接矩形間距離の代表値(G1、G2、…Gn)を算出する。
つまり、図6に示す例は、横軸を矩形間距離、縦軸を同じ矩形間距離を持つ矩形間の個数(頻度数)とした場合のヒストグラムを示したものである。図6の例に示すように、矩形間距離算出モジュール122で算出される矩形間距離は、対象としている電子ドキュメント中で用いられる文字間の距離に基づいて分布するため、ヒストグラム中にはある行における矩形間距離の値を中心とした山ができる。つまり、図6で示す例では3つの山(グループ601〜603)があるため、ドキュメント中に3種類の文字間の距離が使われていることになる。
矩形間距離代表値算出モジュール132は、図6の例に示すようなヒストグラムを生成し、ヒストグラムの山(グループ601〜603)を検出して、矩形間距離の代表値(図6の例の場合では、G1、G2、G3)を算出する。それぞれの代表値は、ヒストグラムの各山での最大値を超えるような値とする。また図7の例に示すように、同じ矩形間距離を持つ矩形間距離の個数に対して閾値Thを設けて、その閾値以上で矩形間距離としてその山における最大の値とするようにしてもよい。つまり、図7に示す例では、矩形間距離の代表値は、G11、G22、G33となる。
文字情報補正処理モジュール140は、代表値算出処理モジュール130と接続されており、代表値算出処理モジュール130から2つの代表値を受け取り、文字情報データを補正し、その補正した文字情報データを出力する。
次に、文字情報補正処理モジュール140は、図8の例に示すように、ライン特徴算出モジュール120で算出されたmin_y、max_y、代表値算出処理モジュール130で算出された代表値(H1、H2、・・・Hn)、(G1、G2、…Gn)で、各ライン毎に分類された文字情報データを補正する。各補正値は以下のように算出する。
補正矩形高さHは、補正対象の文字情報データが属する行高さhに最も近い行高さの代表値(H1、H2、・・・Hn)から選択する。
補正矩形幅Wは、補正対象の文字情報データが属する行の平均外接矩形間距離に最も近い外接矩形間距離の代表値(G1、G2、…Gn)を選択し、以下の式(1)を用いて算出する。
W = G + w ・・・・・ 式(1)
ここでGは選択された矩形間距離の代表値であり、wは補正前(ライン認識処理モジュール110が受け付けた元の文字情報データのもの)の外接矩形幅である。
補正矩形820の左上の座標値(new_x,new_y)は、以下の式(2)で算出する。
new_x = x − G/2
new_y = min_y − (H − h)/2 ・・・・・ 式(2)
ここでxは補正前の外接矩形810の左上のx座標値、Gは選択された外接矩形間距離の代表値、min_yは補正対象の文字情報データが属する行のy座標の最小値、Hは補正矩形高さ、hは補正前の行高さである。
補正矩形820から外接矩形810への相対移動量shiftx、shiftyは、以下の式(3)で算出する。
shiftx = G/2
shifty = y − new_y ・・・・・ 式(3)
ここでyは補正前の外接矩形810の左上y座標値である。
前述したように文字情報補正処理モジュール140では、入力された文字情報データの外接矩形情報から補正文字矩形を生成し、文字同士の矩形高さが揃い、また矩形同士の隙間が空かないような補正を行う。
また文字情報補正処理モジュール140は、電子ドキュメント内に同等の形状の文字がある場合(文字画像として同等である場合又は外接矩形として同等である場合)には、補正文字矩形の位置及び大きさを同等の値とするようにしてもよい。そして、それら補正文字矩形のデータを補正文字情報データ内で共有することによって、電子ドキュメント全体のデータ量を削減するようにしてもよい。
また文字情報補正処理モジュール140は、前述した補正に加えて、電子ドキュメント内の文字の言語に基づいて、補正後の文字矩形の大きさを算出するようにしてもよい。例えば、対象とする電子ドキュメントが日本語の場合には、補正後の文字矩形が正方形となるように、補正矩形幅Wを補正矩形高さHと等しくなるよう設定するようにしてもよい。なお、対象とする電子ドキュメント内の文字の言語の判断は、その電子ドキュメント内に含まれている言語に関するヘッダ、文字コード、画像である場合は文字認識処理の結果等を用いて行う。
図13を参照して、本実施の形態のハードウェア構成例について説明する。図13に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1317と、プリンタなどのデータ出力部1318を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1301は、前述の実施の形態において説明した各種のモジュール、すなわち、ライン認識処理モジュール110、ライン特徴算出モジュール120、代表値算出処理モジュール130、文字情報補正処理モジュール140等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1302は、CPU1301が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1303は、CPU1301の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1304により相互に接続されている。
ホストバス1304は、ブリッジ1305を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1306に接続されている。
キーボード1308、マウス等のポインティングデバイス1309は、操作者により操作される入力デバイスである。ディスプレイ1310は、液晶表示装置又はCRT(Cathode Ray Tube)などからなり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1311は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1301によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、文字情報データや文字情報補正処理モジュール140の処理結果データなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1312は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1313に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1307、外部バス1306、ブリッジ1305、及びホストバス1304を介して接続されているRAM1303に供給する。リムーバブル記録媒体1313も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1314は、外部接続機器1315を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1314は、インタフェース1307、及び外部バス1306、ブリッジ1305、ホストバス1304等を介してCPU1301等に接続されている。通信部1316は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1317は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1318は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図13に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図13に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図13に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
前記実施の形態においては、主に横書き電子ドキュメントの場合の行の高さを用いることを示したが、縦書きの場合は列の幅を同様に用いる。
なお、数式を用いて説明したが、数式には、その数式と同等のものを含めてもよい。同等のものとは、その数式そのものの他に、最終的な結果に影響を及ぼさない程度の数式の変形、または数式をアルゴリズミックな解法で解くこと等が含まれる。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
本実施の形態の構成例についての概念的なモジュール構成図である。 ライン認識処理モジュールによるラインの抽出処理例を示す説明図である。 ライン特徴算出モジュールによるライン特徴の抽出処理例を示す説明図である。 行高さの代表値の算出処理例を示す説明図である。 行高さの代表値の算出処理例を示す説明図である。 矩形間距離の代表値の算出処理例を示す説明図である。 矩形間距離の代表値の算出処理例を示す説明図である。 文字矩形の補正の算出処理例を示す説明図である。 テキストが表示されている電子ドキュメントの表示例を示す説明図である。 テキストを選択した状態の電子ドキュメントの表示例を示す説明図である。 別のアプリケーションにテキストを複写した場合の別の電子ドキュメントの表示例を示す説明図である。 画像処理後のフォントを埋め込んだ電子ドキュメントにおいて、テキストを選択した状態の表示例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
符号の説明
110…ライン認識処理モジュール
120…ライン特徴算出モジュール
121…行高列幅算出モジュール
122…矩形間距離算出モジュール
130…代表値算出処理モジュール
131…行高列幅代表値算出モジュール
132…矩形間距離代表値算出モジュール
140…文字情報補正処理モジュール

Claims (7)

  1. 電子文書内の画素塊の矩形に関する情報を用いて、該電子文書内の行又は列であるラインを抽出するライン抽出手段と、
    前記ライン抽出手段によって抽出されたラインである行の高さ又は該ラインである列の幅に基づいて第1の代表値を算出する第1代表値算出手段と、
    前記ライン抽出手段によって抽出されたライン内の画素塊間の間隔に基づいて第2の代表値を算出する第2代表値算出手段と、
    前記第1代表値及び前記第2代表値に基づいて、文字列が選択された場合に、その文字列を囲む反転矩形形状が長方形となるように、文字同士の矩形高さ又は矩形幅が揃い、矩形同士の隙間が空かないように、前記電子文書内の画素塊を囲む矩形の位置及び大きさを算出する矩形算出手段
    を具備することを特徴とする情報処理装置。
  2. 前記電子文書内の画素塊の矩形に関する情報として、該画素塊の矩形の高さ又は幅方向の位置を含み、
    前記ライン抽出手段は、該画素塊の矩形の高さ又は幅方向の位置を用いて、該画素塊を含むラインである各行の高さ又は各列の幅を抽出する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記第1代表値算出手段は、前記ラインである行の高さ又は列の幅の値における頻度数に基づいて第1の代表値を算出する
    ことを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記第2代表値算出手段は、前記ライン内の画素塊間の間隔における頻度数に基づいて第2の代表値を算出する
    ことを特徴とする請求項1から3のいずれか一項に記載の情報処理装置。
  5. 前記矩形算出手段は、前記電子文書内に同等の形状の画素塊がある場合には、該画素塊を囲む矩形の位置及び大きさを同等の値とする
    ことを特徴とする請求項1から4のいずれか一項に記載の情報処理装置。
  6. 前記矩形算出手段は、前記電子文書内の文字の言語に基づいて、前記画素塊を囲む矩形の大きさを算出する
    ことを特徴とする請求項1から5のいずれか一項に記載の情報処理装置。
  7. コンピュータを、
    電子文書内の画素塊の矩形に関する情報を用いて、該電子文書内の行又は列であるラインを抽出するライン抽出手段と、
    前記ライン抽出手段によって抽出されたラインである行の高さ又は該ラインである列の幅に基づいて第1の代表値を算出する第1代表値算出手段と、
    前記ライン抽出手段によって抽出されたライン内の画素塊間の間隔に基づいて第2の代表値を算出する第2代表値算出手段と、
    前記第1代表値及び前記第2代表値に基づいて、文字列が選択された場合に、その文字列を囲む反転矩形形状が長方形となるように、文字同士の矩形高さ又は矩形幅が揃い、矩形同士の隙間が空かないように、前記電子文書内の画素塊を囲む矩形の位置及び大きさを算出する矩形算出手段
    として機能させることを特徴とする情報処理プログラム。
JP2008031332A 2008-02-13 2008-02-13 情報処理装置及び情報処理プログラム Active JP4900271B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008031332A JP4900271B2 (ja) 2008-02-13 2008-02-13 情報処理装置及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008031332A JP4900271B2 (ja) 2008-02-13 2008-02-13 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2009193191A JP2009193191A (ja) 2009-08-27
JP4900271B2 true JP4900271B2 (ja) 2012-03-21

Family

ID=41075164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008031332A Active JP4900271B2 (ja) 2008-02-13 2008-02-13 情報処理装置及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP4900271B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09106437A (ja) * 1995-10-11 1997-04-22 Ricoh Co Ltd 文字切出し装置および文字切出し方法
JP3917349B2 (ja) * 2000-05-30 2007-05-23 富士通株式会社 文字認識結果を利用して情報を検索する検索装置および方法
JP4070486B2 (ja) * 2002-03-15 2008-04-02 株式会社リコー 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム

Also Published As

Publication number Publication date
JP2009193191A (ja) 2009-08-27

Similar Documents

Publication Publication Date Title
JP5321109B2 (ja) 情報処理装置及び情報処理プログラム
JP4623169B2 (ja) 画像処理装置及び画像処理プログラム
JP2006295606A (ja) 画像処理装置及びその方法、プログラム並びに記憶媒体
JP2010021769A (ja) 画像処理装置及び画像処理プログラム
JP2006050551A (ja) 画像処理装置及びその方法、並びにプログラム及び記憶媒体
JP4626777B2 (ja) 情報処理装置及び情報処理プログラム
JP2009251872A (ja) 情報処理装置及び情報処理プログラム
JP6221220B2 (ja) 画像処理装置及び画像処理プログラム
JP4900271B2 (ja) 情報処理装置及び情報処理プログラム
JP5742283B2 (ja) 画像処理装置及び画像処理プログラム
JP5062076B2 (ja) 情報処理装置及び情報処理プログラム
JP5489894B2 (ja) 画像処理装置及び画像処理プログラム
JP5056063B2 (ja) 画像処理装置及び画像処理プログラム
JP4894664B2 (ja) 画像処理システム及び画像処理プログラム
JP5949248B2 (ja) 情報処理装置及び情報処理プログラム
JP5928714B2 (ja) 情報処理装置及び情報処理プログラム
JP6003375B2 (ja) 画像処理装置及び画像処理プログラム
JP2006074166A (ja) 画像処理装置及びその方法
US8059906B2 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
JP2009187168A (ja) 情報処理装置及び情報処理プログラム
JP6409423B2 (ja) 画像処理装置及び画像処理プログラム
JP4973536B2 (ja) 画像処理装置及び画像処理プログラム
JP2011100252A (ja) 画像処理装置及び画像処理プログラム
JP6606885B2 (ja) 画像処理装置及び画像処理プログラム
JP6281309B2 (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090825

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110809

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111006

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111206

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111219

R150 Certificate of patent or registration of utility model

Ref document number: 4900271

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150113

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350