JP4900271B2 - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP4900271B2 JP4900271B2 JP2008031332A JP2008031332A JP4900271B2 JP 4900271 B2 JP4900271 B2 JP 4900271B2 JP 2008031332 A JP2008031332 A JP 2008031332A JP 2008031332 A JP2008031332 A JP 2008031332A JP 4900271 B2 JP4900271 B2 JP 4900271B2
- Authority
- JP
- Japan
- Prior art keywords
- rectangle
- representative value
- line
- electronic document
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Description
このような電子ドキュメントでは、PC上で、その電子ドキュメントを表示することが行われる。
そして、その電子ドキュメントに記述されているテキスト情報を、操作者の操作に応じてPC上で選択し、コピー&ペースト等の処理が行われる。テキスト情報をPC上で選択する(例えば、電子ドキュメントを表示しているディスプレイ上に表示されているテキスト位置でマウスを左クリックしながらテキスト位置を右に移動させる等の動作でテキスト情報を選択することができる)場合、選択したテキスト位置が反転して、どのテキストを選択しているかを示すようなビューワが存在している。
一方、画像を文字認識して、電子ドキュメントを生成することも行われている。
本発明は、電子文書内の画素塊を囲む矩形の位置及び大きさを揃えて、ラインの形状を整えるようにした情報処理装置及び情報処理プログラムを提供することを目的としている。
請求項1の発明は、電子文書内の画素塊の矩形に関する情報を用いて、該電子文書内の行又は列であるラインを抽出するライン抽出手段と、前記ライン抽出手段によって抽出されたラインである行の高さ又は該ラインである列の幅に基づいて第1の代表値を算出する第1代表値算出手段と、前記ライン抽出手段によって抽出されたライン内の画素塊間の間隔に基づいて第2の代表値を算出する第2代表値算出手段と、前記第1代表値及び前記第2代表値に基づいて、文字列が選択された場合に、その文字列を囲む反転矩形形状が長方形となるように、文字同士の矩形高さ又は矩形幅が揃い、矩形同士の隙間が空かないように、前記電子文書内の画素塊を囲む矩形の位置及び大きさを算出する矩形算出手段を具備することを特徴とする情報処理装置である。
例えば、図9に示す例のように「美しい日本」という文字列が表示されている電子ドキュメント900の「美しい日本」のテキストをPC上で選択すると、図10に示す例のように「美しい日本」の部分が反転して(図10に示す選択テキスト1001)、「美しい日本」が選択されたことをユーザに示すことができる。
あるいは、前述のようにテキストを選択した状態で、PC上でコピー&ペーストを行うと、別のファイル上に「美しい日本」というテキスト情報をコピーすることが可能となる。図11に示す例のように、ワードプロセッサ等のような別のアプリケーションファイル(図11に示す電子ドキュメント1100)上に、テキスト情報をペーストすることができる。
このように、文字形状を指定するためのフォント情報の文字部分に前述したような画像処理が施された場合に、文字部分の画像処理に応じた適切なフォント情報の更新が行われないと、電子ドキュメントをビューワで閲覧した場合のテキスト情報選択動作の挙動がオリジナルの電子ドキュメントと異なることがある。
例えば図12に示す例のように、「美しい日本」のテキストを選択したことを示す反転矩形形状(図12に示す選択テキスト1201〜1205)が、図10で示した例のように整った長方形の反転矩形形状にはならず、各文字で矩形が独立し、さらにはその大きさも異なる矩形形状となり、反転矩形形状の品質が低下する。これは文字部分の画像処理によりオリジナルのフォント情報に存在した“文字列として選択された場合の形状も考慮した”矩形情報が失われているか、あるいは適切に情報の修正が行われていないことに起因する。
したがって、反転矩形形状を整ったものにするためには、電子ドキュメント内に埋め込む文字矩形情報を適切に修正する必要がある。
本実施の形態によって出力される電子ドキュメントは、フォント情報が埋め込まれており、その文字列を選択した場合における反転矩形形状の品質劣化が抑制されたものである。
本実施の形態では、電子ドキュメントに埋め込まれるフォント情報内の矩形情報の修正を、文字毎の情報にのみ基づくのではなく、その電子ドキュメント全体から矩形情報の修正に必要な情報を抽出又は算出して、それらに基づいて文字毎の矩形の修正を行うものである。
(1)電子ドキュメント内の文字外接矩形情報(その電子ドキュメント内の絶対座標値及び矩形サイズ)から行を抽出する。
(2)行の高さとして、すべての文字外接矩形が収まるような最小値を求める。
(3)さらに電子ドキュメント内の文字外接矩形情報から外接矩形間隔を求める。
(4)各行の高さの集合から、矩形高さの代表値を決定する。
(5)各外接矩形間隔の集合から、電子ドキュメント中の文字外接矩形に隙間が生じないように外接矩形間隔の代表値を決定する。
(6)文字外接矩形情報、矩形高さの代表値及び外接矩形間隔の代表値に基づいて文字毎の矩形を修正する。
(1)電子ドキュメント内の文字外接矩形情報(その電子ドキュメント内の絶対座標値及び矩形サイズ)から列を抽出する。
(2)列の幅として、すべての文字外接矩形が収まるような最小値を求める。
(3)さらに電子ドキュメント内の文字外接矩形情報から外接矩形間隔を求める。
(4)各列幅の集合から、矩形幅の代表値を決定する。
(5)各外接矩形間隔の集合から、電子ドキュメント中の文字外接矩形に隙間が生じないように外接矩形間隔の代表値を決定する。
(6)文字外接矩形情報、矩形幅の代表値及び外接矩形間隔の代表値に基づいて文字毎の矩形を修正する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。
また、画素塊とは、4連結又は8連結で連続する画素領域を少なくとも含み、これらの画素領域の集合をも含む。これらの画素領域の集合とは、4連結等で連続した画素領域が複数あり、その複数の画素領域は近傍にあるものをいう。ここで、近傍にあるものとは、例えば、互いの画素領域が距離的に近いもの、文章としての1行から1文字ずつ切り出すように縦又は横方向に射影し、空白地点で切り出した画像領域、又は所定間隔で切り出した画像領域等がある。例えば、文字認識処理を行って、1文字として認識された画像を1つの画素塊としてもよい。
なお、1つの画素塊として、1文字の画像となる場合が多い。以下、画素塊のことを文字又は文字画像ともいう。
ライン認識処理モジュール110は、文字情報データを受け付ける。ここでいう文字情報データとは、電子ドキュメント中における文字の絶対座標、文字の大きさを表す外接矩形サイズ(外接矩形幅、高さ)、縦書き文字なのか横書き文字なのかを表す情報などである。
ライン認識処理モジュール110は、図2(a)の例に示すように、注目文字情報データの外接矩形(注目文字矩形212)の左上y座標(upper_y)が、一つ前の文字情報データの外接矩形(注目文字矩形211)の左下y座標(lower_y)より小さいときは(upper_y<lower_y)、その注目文字情報データの外接矩形(注目文字矩形212)は、注目文字矩形211と同じ行であると認識する。なお、左上を原点(0,0)としている。
また、図2(b)の例に示すように、注目文字情報データの外接矩形(注目文字矩形222)の左上y座標(upper_y)が、一つ前の文字情報データの外接矩形(注目文字矩形221)の左下y座標(lower_y)より大きいときは(lower_y<upper_y)、異なる行であると認識する。
そして、同じライン内にあると認識された文字情報データの列をライン特徴算出モジュール120へ渡す。
なお、受け付けた文字情報データは、文字画像の外接矩形の出現順(例えば、横書きの場合は、左上から右へ走査し、次の行ではまた左から右へ走査した順番に並んでいる)となっているので、一つ前の文字情報データの外接矩形とは、出現順で一つ前である。また、外接矩形の左上の座標を用いてソートしてもよい。
つまり、ライン認識処理モジュール110によって同じ行と認識された文字情報データ列から行高さ及び外接矩形間距離などのラインに関する特徴を算出する。
図4に示す例は、横軸を行高さ、縦軸を同じ行高さを持つ行の本数(頻度数)とした場合のヒストグラムを示したものである。図4の例に示すように、行高列幅算出モジュール121で算出される行高さは、対象としている電子ドキュメント中で用いられる文字の大きさに基づいて分布するため、ヒストグラム中にはある行高さの値を中心とした山ができる。つまり、図4で示す例では3つの山(グループ401〜403)があるため、ドキュメント中に3種類の文字の大きさが使われていることになる。
つまり、図6に示す例は、横軸を矩形間距離、縦軸を同じ矩形間距離を持つ矩形間の個数(頻度数)とした場合のヒストグラムを示したものである。図6の例に示すように、矩形間距離算出モジュール122で算出される矩形間距離は、対象としている電子ドキュメント中で用いられる文字間の距離に基づいて分布するため、ヒストグラム中にはある行における矩形間距離の値を中心とした山ができる。つまり、図6で示す例では3つの山(グループ601〜603)があるため、ドキュメント中に3種類の文字間の距離が使われていることになる。
補正矩形幅Wは、補正対象の文字情報データが属する行の平均外接矩形間距離に最も近い外接矩形間距離の代表値(G1、G2、…Gn)を選択し、以下の式(1)を用いて算出する。
W = G + w ・・・・・ 式(1)
ここでGは選択された矩形間距離の代表値であり、wは補正前(ライン認識処理モジュール110が受け付けた元の文字情報データのもの)の外接矩形幅である。
new_x = x − G/2
new_y = min_y − (H − h)/2 ・・・・・ 式(2)
ここでxは補正前の外接矩形810の左上のx座標値、Gは選択された外接矩形間距離の代表値、min_yは補正対象の文字情報データが属する行のy座標の最小値、Hは補正矩形高さ、hは補正前の行高さである。
shiftx = G/2
shifty = y − new_y ・・・・・ 式(3)
ここでyは補正前の外接矩形810の左上y座標値である。
なお、数式を用いて説明したが、数式には、その数式と同等のものを含めてもよい。同等のものとは、その数式そのものの他に、最終的な結果に影響を及ぼさない程度の数式の変形、または数式をアルゴリズミックな解法で解くこと等が含まれる。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
120…ライン特徴算出モジュール
121…行高列幅算出モジュール
122…矩形間距離算出モジュール
130…代表値算出処理モジュール
131…行高列幅代表値算出モジュール
132…矩形間距離代表値算出モジュール
140…文字情報補正処理モジュール
Claims (7)
- 電子文書内の画素塊の矩形に関する情報を用いて、該電子文書内の行又は列であるラインを抽出するライン抽出手段と、
前記ライン抽出手段によって抽出されたラインである行の高さ又は該ラインである列の幅に基づいて第1の代表値を算出する第1代表値算出手段と、
前記ライン抽出手段によって抽出されたライン内の画素塊間の間隔に基づいて第2の代表値を算出する第2代表値算出手段と、
前記第1代表値及び前記第2代表値に基づいて、文字列が選択された場合に、その文字列を囲む反転矩形形状が長方形となるように、文字同士の矩形高さ又は矩形幅が揃い、矩形同士の隙間が空かないように、前記電子文書内の画素塊を囲む矩形の位置及び大きさを算出する矩形算出手段
を具備することを特徴とする情報処理装置。 - 前記電子文書内の画素塊の矩形に関する情報として、該画素塊の矩形の高さ又は幅方向の位置を含み、
前記ライン抽出手段は、該画素塊の矩形の高さ又は幅方向の位置を用いて、該画素塊を含むラインである各行の高さ又は各列の幅を抽出する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記第1代表値算出手段は、前記ラインである行の高さ又は列の幅の値における頻度数に基づいて第1の代表値を算出する
ことを特徴とする請求項1又は2に記載の情報処理装置。 - 前記第2代表値算出手段は、前記ライン内の画素塊間の間隔における頻度数に基づいて第2の代表値を算出する
ことを特徴とする請求項1から3のいずれか一項に記載の情報処理装置。 - 前記矩形算出手段は、前記電子文書内に同等の形状の画素塊がある場合には、該画素塊を囲む矩形の位置及び大きさを同等の値とする
ことを特徴とする請求項1から4のいずれか一項に記載の情報処理装置。 - 前記矩形算出手段は、前記電子文書内の文字の言語に基づいて、前記画素塊を囲む矩形の大きさを算出する
ことを特徴とする請求項1から5のいずれか一項に記載の情報処理装置。 - コンピュータを、
電子文書内の画素塊の矩形に関する情報を用いて、該電子文書内の行又は列であるラインを抽出するライン抽出手段と、
前記ライン抽出手段によって抽出されたラインである行の高さ又は該ラインである列の幅に基づいて第1の代表値を算出する第1代表値算出手段と、
前記ライン抽出手段によって抽出されたライン内の画素塊間の間隔に基づいて第2の代表値を算出する第2代表値算出手段と、
前記第1代表値及び前記第2代表値に基づいて、文字列が選択された場合に、その文字列を囲む反転矩形形状が長方形となるように、文字同士の矩形高さ又は矩形幅が揃い、矩形同士の隙間が空かないように、前記電子文書内の画素塊を囲む矩形の位置及び大きさを算出する矩形算出手段
として機能させることを特徴とする情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008031332A JP4900271B2 (ja) | 2008-02-13 | 2008-02-13 | 情報処理装置及び情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008031332A JP4900271B2 (ja) | 2008-02-13 | 2008-02-13 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009193191A JP2009193191A (ja) | 2009-08-27 |
JP4900271B2 true JP4900271B2 (ja) | 2012-03-21 |
Family
ID=41075164
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008031332A Active JP4900271B2 (ja) | 2008-02-13 | 2008-02-13 | 情報処理装置及び情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4900271B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09106437A (ja) * | 1995-10-11 | 1997-04-22 | Ricoh Co Ltd | 文字切出し装置および文字切出し方法 |
JP3917349B2 (ja) * | 2000-05-30 | 2007-05-23 | 富士通株式会社 | 文字認識結果を利用して情報を検索する検索装置および方法 |
JP4070486B2 (ja) * | 2002-03-15 | 2008-04-02 | 株式会社リコー | 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム |
-
2008
- 2008-02-13 JP JP2008031332A patent/JP4900271B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009193191A (ja) | 2009-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5321109B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP4623169B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2006295606A (ja) | 画像処理装置及びその方法、プログラム並びに記憶媒体 | |
JP2010021769A (ja) | 画像処理装置及び画像処理プログラム | |
JP2006050551A (ja) | 画像処理装置及びその方法、並びにプログラム及び記憶媒体 | |
JP4626777B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
JP6221220B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4900271B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5062076B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5489894B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5056063B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4894664B2 (ja) | 画像処理システム及び画像処理プログラム | |
JP5949248B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5928714B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6003375B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2006074166A (ja) | 画像処理装置及びその方法 | |
US8059906B2 (en) | Image processing apparatus, image processing method, computer-readable medium and computer data signal | |
JP2009187168A (ja) | 情報処理装置及び情報処理プログラム | |
JP6409423B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4973536B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2011100252A (ja) | 画像処理装置及び画像処理プログラム | |
JP6606885B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6281309B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5531661B2 (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090825 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110728 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110809 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111006 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111206 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4900271 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150113 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |