JP5062076B2 - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP5062076B2 JP5062076B2 JP2008185451A JP2008185451A JP5062076B2 JP 5062076 B2 JP5062076 B2 JP 5062076B2 JP 2008185451 A JP2008185451 A JP 2008185451A JP 2008185451 A JP2008185451 A JP 2008185451A JP 5062076 B2 JP5062076 B2 JP 5062076B2
- Authority
- JP
- Japan
- Prior art keywords
- paragraph
- line
- information
- rectangle
- height
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Description
このような電子ドキュメントでは、PC上で、その電子ドキュメントを表示することが行われる。
そして、その電子ドキュメントに記述されているテキスト情報を、操作者の操作に応じてPC上で選択し、コピー&ペースト等の処理が行われる。テキスト情報をPC上で選択する(例えば、電子ドキュメントを表示しているディスプレイ上に表示されているテキスト位置でマウスを左クリックしながらテキスト位置を右に移動させる等の動作でテキスト情報を選択することができる)場合、選択したテキスト位置が反転して、どのテキストを選択しているかを示すようなビューワが存在している。
一方、画像を文字認識して、電子ドキュメントを生成することも行われている。
本発明は、電子文書内の画素塊を囲む矩形の位置及び大きさを揃えて、ラインの形状を整えるようにした情報処理装置及び情報処理プログラムを提供することを目的としている。
請求項1の発明は、電子文書内の画素塊を囲む矩形に関する情報を用いて、該電子文書内の行又は列であるラインを抽出するライン抽出手段と、前記ライン抽出手段によって抽出されたラインに応じて、前記電子文書内の段落を抽出する段落抽出手段と、前記段落抽出手段によって抽出された段落を統合する段落統合手段と、前記段落統合手段で統合された段落中のラインである行の高さ又は列の幅、及びラインを構成する画素塊間の間隔に基づいて、該統合された段落内の画素塊を囲む矩形の位置及び大きさを算出する矩形算出手段を具備し、前記段落抽出手段は、抽出した段落に関する情報として、該段落に含まれるラインである各行の高さ又は各列の幅を用いて、該段落の代表値を算出し、前記段落統合手段は、前記段落抽出手段で抽出された段落の代表値を用いて段落を統合し、前記段落抽出手段が算出する前記代表値は、段落内の最も大きい行高さ、又は、段落内の最も大きい列幅であり、前記段落統合手段は、段落間の代表値の差分値を算出し、該差分値が最小となる2つの段落を抽出し、該抽出した差分値を予め定めた閾値と比較し、該閾値より小さい場合は、該2つの段落を統合することを特徴とする情報処理装置である。
例えば、図14に示す例のように「美しい日本」という文字列が表示されている電子ドキュメント1400の「美しい日本」のテキストをPC上で選択すると、図15に示す例のように「美しい日本」の部分が反転して(図15に示す選択テキスト1501)、「美しい日本」が選択されたことをユーザに示すことができる。
あるいは、前述のようにテキストを選択した状態で、PC上でコピー&ペーストを行うと、別のファイル上に「美しい日本」というテキスト情報をコピーすることが可能となる。図16に示す例のように、ワードプロセッサ等のような別のアプリケーションファイル(図16に示す電子ドキュメント1600)上に、テキスト情報をペーストすることができる。
このように、文字形状を指定するためのフォント情報の文字部分に前述したような画像処理が施された場合に、文字部分の画像処理に応じた適切なフォント情報の更新が行われないと、電子ドキュメントをビューワで閲覧した場合のテキスト情報選択動作の挙動がオリジナルの電子ドキュメントと異なることがある。
例えば図17に示す例のように、「美しい日本」のテキストを選択したことを示す反転矩形形状(図17に示す選択テキスト1701から1705)が、図15で示した例のように整った長方形の反転矩形形状にはならず、各文字で矩形が独立し、さらにはその大きさも異なる矩形形状となり、反転矩形形状の品質が低下する。これは文字部分の画像処理によりオリジナルのフォント情報に存在した“文字列として選択された場合の形状も考慮した”矩形情報が失われているか、あるいは適切に情報の修正が行われていないことに起因する。
したがって、反転矩形形状を整ったものにするためには、電子ドキュメント内に埋め込む文字矩形情報を適切に修正する必要がある。
本実施の形態によって出力される電子ドキュメントは、フォント情報が埋め込まれており、その文字列を選択した場合における反転矩形形状の品質劣化が抑制されたものである。
本実施の形態では、電子ドキュメントに埋め込まれるフォント情報内の矩形情報の修正を、文字毎の情報にのみ基づくのではなく、その電子ドキュメント全体から矩形情報の修正に必要な情報を抽出又は算出(段落の抽出、その段落の統合処理等を含む)して、それらに基づいて文字毎の矩形の修正を行うものである。
(A1)電子ドキュメント内の文字外接矩形情報(その電子ドキュメント内の座標値(絶対座標値又は相対座標値のいずれであってもよい)及び矩形サイズ(例えば、その矩形の高さ、幅の組))から行を抽出する。なお、文字外接矩形情報とは、電子ドキュメント内の文字を囲む矩形(外接矩形)に関する情報である。
(A2)行に関する特徴情報(例えば、行中の全ての文字外接矩形が収まるような最小値、行矩形サイズ、行座標値等)を求める。
(A3)複数の行からなる段落を行に関する特徴情報に基づいて抽出し、その段落に関する特徴を算出する。
(A4)その算出された段落に関する特徴に基づいて、複数の段落を統合する。
(A5)統合された段落に含まれる各行の行に関する特徴情報から矩形高さ及び矩形幅の修正値を決定する。
(A6)文字外接矩形情報、矩形高さ及び矩形幅の修正値に基づいて文字毎の矩形情報を修正する。
(B1)電子ドキュメント内の文字外接矩形情報(その電子ドキュメント内の座標値(絶対座標値又は相対座標値のいずれであってもよい)及び矩形サイズ(例えば、その矩形の高さ、幅の組))から列を抽出する。なお、文字外接矩形情報とは、電子ドキュメント内の文字を囲む矩形(外接矩形)に関する情報である。
(B2)列に関する特徴情報(例えば、列中の全ての文字外接矩形が収まるような最小値、列矩形サイズ、列座標値等)を求める。
(B3)複数の列からなる段落を列に関する特徴情報に基づいて抽出し、その段落に関する特徴を算出する。
(B4)その算出された段落に関する特徴に基づいて、複数の段落を統合する。
(B5)統合された段落に含まれる各列の列に関する特徴情報から矩形高さ及び矩形幅の修正値を決定する。
(B6)文字外接矩形情報、矩形高さ及び矩形幅の修正値に基づいて文字毎の矩形情報を修正する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前であることをいい、本実施の形態による処理が始まる前、本実施の形態による処理が始まった後であっても、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
また、画素塊とは、4連結又は8連結で連続する画素領域を少なくとも含み、これらの画素領域の集合をも含む。これらの画素領域の集合とは、4連結等で連続した画素領域が複数あり、その複数の画素領域は近傍にあるものをいう。ここで、近傍にあるものとは、例えば、互いの画素領域が距離的に近いもの、文章としての1行から1文字ずつ切り出すように縦又は横方向に射影し、空白地点で切り出した画像領域、又は予め定められた間隔で切り出した画像領域等がある。例えば、文字認識処理を行って、1文字として認識された画像を1つの画素塊としてもよい。
なお、1つの画素塊として、1文字の画像となる場合が多い。本実施の形態では、画素塊のことを文字又は文字画像ともいう。
ライン認識処理モジュール110は、文字情報データを受け付ける。ここでいう文字情報データとは、電子ドキュメント内の画素塊の矩形に関する情報を少なくとも含む。例えば、前述の文字外接矩形情報、フォント情報であってもよい。また、画素塊に対応している文字の認識順序に関する情報(文字認識装置によって認識順に順序付けられた番号)が含まれていてもよい。例えば、電子ドキュメント中における文字の座標(例えば、文字を囲む外接矩形の左上座標)、文字の大きさを表す外接矩形サイズ(外接矩形幅、高さ)、文字形状、文字コード、文字の順序情報、縦書き文字なのか横書き文字なのかを表す情報などである。本実施の形態では、これらの文字情報データを文字認識装置から受け取った場合について説明する。ただし、文字認識装置に限る必要はなく、文字の外接矩形を受け取って、同等の文字情報データを生成するようにしてもよい。
ライン認識処理モジュール110は、図2(a)の例に示すように、注目文字情報データの外接矩形(注目外接矩形212)の左上y座標(upper_y)が、その一つ前の文字情報データの外接矩形(注目外接矩形211)の左下y座標(lower_y)より小さいときは(upper_y<lower_y)、その注目文字情報データの外接矩形(注目外接矩形212)は、注目外接矩形211と同じ行であると認識する。なお、左上を原点(0,0)として、x座標は右方向へ、y座標は下方向へ向かうと数値が増える座標系である。
また、図2(b)の例に示すように、注目文字情報データの外接矩形(注目外接矩形222)の左上y座標(upper_y)が、その一つ前の文字情報データの外接矩形(注目外接矩形221)の左下y座標(lower_y)より大きいときは(lower_y<upper_y)、異なる行であると認識する。
そして、同じライン内にあると認識された文字情報データの列をライン特徴算出モジュール120へ渡す。
なお、受け付けた文字情報データは、文字画像の外接矩形の出現順序(例えば、横書きの場合は、左上から右へ走査し、次の行ではまた左から右へ走査した順番に並んでいる)となっているので、一つ前の文字情報データの外接矩形とは、出現順序で一つ前である。また、外接矩形の左上の座標を用いてソートしてもよい。
ライン認識処理モジュール110は、図3(a)の例に示すように、注目文字情報データの外接矩形(注目外接矩形303)と、その一つ前の文字情報データの外接矩形(外接矩形302)との外接矩形間距離311(以下、現外接矩形間距離ともいう)が、現在処理している行において、既に同一行であると認識された各外接矩形間の距離の平均値(以下、平均外接矩形間距離ともいう)をα倍した値以下である場合は(つまり、現外接矩形間距離≦平均外接矩形間距離×αを満たす場合)、注目外接矩形303は外接矩形302と同じ行であると認識する。なお、αは、ライン認識パラメータであり、予め定められた値である。例えば、文字情報データに応じて定められる。
また、図3(b)の例に示すように、注目文字情報データの外接矩形(注目外接矩形323)と、その一つ前の文字情報データの外接矩形(外接矩形322)との外接矩形間距離331が、現在処理している行における平均外接矩形間距離をα倍した値より大である場合は(現外接矩形間距離>平均外接矩形間距離×α)、注目外接矩形323は外接矩形322とは異なる行であると認識する。
つまり、ライン認識処理モジュール110によって同じ行と認識された文字情報データ列から行高さ、行幅、行外接矩形座標、平均外接矩形間距離などのラインに関する特徴を算出する。
また、行高列幅算出モジュール121は、行高さ(h)を先に求めた行外接矩形座標を用いて、h = max_y − min_y として求める。同様に、行幅(w)を行外接矩形座標を用いて、w = max_x − min_x として求める。これらの行高さ、行幅は、各外接矩形のサイズ(高さ、幅)又はその座標を用いて求める。
また、矩形間距離算出モジュール122は、平均文字外接矩形間距離を、同じ行に属する隣接する文字情報データの外接矩形間距離g0, g1, ……, gnの平均値として求める。また、最大外接矩形間距離max_gを、g0, g1, ……, gnのうちの最大値として求める。なお、リストデータとしてg0, g1, …… , gnのそれぞれの値も保持するようにしてもよい。
ステップS502では、まず初めにライン認識処理モジュール110で認識された行に関して、行外接矩形のy座標値であるmin_y値で昇順にソートする。
ステップS504では、ステップS502でソートされた行を全て探索(ステップS506からステップS514までの処理)したかどうかを判定する。全て探索されていればステップS516に、探索が終了していなければステップS506に処理を移す。
ステップS506では、注目する行(以降は、現探索行ともいう)をソート順に選択する。
ステップS508では、現探索行に関して段落に登録されているかどうかを判定する。現探索行が段落に登録されているならば処理をステップS504に戻し、登録されていなければステップS510に処理を移す。
ステップS512では、現段落に対して現探索行が登録できるかどうかを判定する。現探索行が現段落に登録可能ならば処理をステップS514に移し、登録できないならば処理をステップS504に戻す。なお、ステップS512における現探索行の登録可否処理の詳細は、図7を用いて後で詳しく説明する。
ここで、図6に段落情報の具体的な例を示す。段落情報として、例えば、その段落の位置情報(例えば、左上座標及び右下座標)、段落順序値(その段落を読む際の順序)を含む。段落認識処理モジュール130は、図6の例に示すように、段落に登録されている行情報(登録行情報)を用いて、段落に登録された全ての行の行外接矩形(登録行0 600から登録行8 608)を含む矩形を段落外接矩形610として、その左上座標(min_x, min_y)及び右下座標(max_x, max_y)を算出する。また図6には図示していないが、同一段落に登録された各行のうち、最も行高さが大きい値max_hを算出し、段落代表値とする。同一段落に登録された文字情報データ中で最も小さい文字認識順序の値min_orderを算出し、段落順序値とする。
ステップS518では、全ての行が段落登録されたかを判定する。全ての行がいずれかの段落に登録されていれば段落抽出処理を終了する(ステップS599)。いずれの段落にも登録されていない行がある場合には、処理をステップS504に戻し、次の段落抽出処理を行う。
ステップS702において、現探索行が現段落の段落外接矩形に対して、右又は左にずれているかを判定する。つまり、現探索行の左端が現段落の右端より右にあるか否か、又は現探索行の右端が現段落の左端より左にあるか否かを判定する。例えば、図8(a)の例に示すように、現探索行812が現段落810より右にずれているかどうか、又は図8(b)の例に示すように、現探索行832が現段落830よりも左にずれているかどうかを判定する。現探索行が図8の例のように右あるいは左にずれている場合には、現探索行は現段落に登録せず、図5の例に示したステップS504に処理を戻す。それ以外の場合は、処理をステップS704に移す。
より具体的に説明すると、段落統合処理モジュール140は、段落認識処理モジュール130で認識された段落を、各段落の段落代表値(max_h)を用いて統合する。
ステップS1102において、段落認識処理モジュール130で認識された全ての段落の段落代表値max_hの差分値を算出し、その差分値が最小となる2つの段落を抽出する(このときの差分値を以下では「差分最小値」ともいう)。
ステップS1104において、ステップS1102で算出された差分最小値を予め定めた閾値と比較する。前記差分最小値が予め定めた閾値より大きい場合(ステップS1104でNO)は、これ以上統合すべき段落はないと判断して、段落認識処理モジュール130における段落統合処理を終了する(ステップS1199)。前記差分最小値がある所定の閾値より小さい場合(ステップS1104でYES)は、ステップS1106に処理を移す。
ステップS1108において、ステップS1106において統合された段落の段落代表値max_hを、統合元の2つの段落の段落代表値の大きい方で設定し、処理をステップS1102に戻す。つまり、統合後の段落の段落代表値max_hを、元の段落の段落代表値max_hのうち大きい値とする。
このように段落統合処理モジュール140は、前述したように、ステップS1102で算出する差分最小値がステップS1104において予め定めた閾値より大きくなるまでステップS1102からステップS1108の統合処理を繰り返して段落を統合する。
文字情報補正処理モジュール150では、図12の例に示す各補正値を以下のように算出する。
補正矩形高さHには、補正対象の文字情報データが属する統合段落の段落代表値max_hを設定する。
補正矩形幅Wは、補正対象の文字情報データが属する行の最大外接矩形間距離max_gを用いて、以下の式(1)で算出する。
W = max_g + w ・・・・・ 式(1)
ここでwは、補正前(ライン認識処理モジュール110が受け付けた元の文字情報データのもの)の外接矩形幅である。
new_x = x − max_g/2
new_y = min_y − (H − h)/2 ・・・・・ 式(2)
ここでxは補正前の外接矩形1210の左上x座標値、max_gは補正対象の文字情報データが属する行の最大外接矩形間距離の代表値、min_yは補正対象の文字情報データが属する行のy座標の最小値、Hは補正矩形1220の高さ、hは補正前の外接矩形高さである。
shiftx = max_g/2
shifty = y − new_y ・・・・・ 式(3)
ここでyは補正前の外接矩形1210の左上y座標値である。
なお、数式を用いて説明したが、数式には、その数式と同等のものを含めてもよい。同等のものとは、その数式そのものの他に、最終的な結果に影響を及ぼさない程度の数式の変形、又は数式をアルゴリズミックな解法で解くこと等が含まれる。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blue−ray Disk)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
120…ライン特徴算出モジュール
121…行高列幅算出モジュール
122…矩形間距離算出モジュール
130…段落認識処理モジュール
140…段落統合処理モジュール
150…文字情報補正処理モジュール
Claims (9)
- 電子文書内の画素塊を囲む矩形に関する情報を用いて、該電子文書内の行又は列であるラインを抽出するライン抽出手段と、
前記ライン抽出手段によって抽出されたラインに応じて、前記電子文書内の段落を抽出する段落抽出手段と、
前記段落抽出手段によって抽出された段落を統合する段落統合手段と、
前記段落統合手段で統合された段落中のラインである行の高さ又は列の幅、及びラインを構成する画素塊間の間隔に基づいて、該統合された段落内の画素塊を囲む矩形の位置及び大きさを算出する矩形算出手段
を具備し、
前記段落抽出手段は、抽出した段落に関する情報として、該段落に含まれるラインである各行の高さ又は各列の幅を用いて、該段落の代表値を算出し、
前記段落統合手段は、前記段落抽出手段で抽出された段落の代表値を用いて段落を統合し、
前記段落抽出手段が算出する前記代表値は、段落内の最も大きい行高さ、又は、段落内の最も大きい列幅であり、
前記段落統合手段は、段落間の代表値の差分値を算出し、該差分値が最小となる2つの段落を抽出し、該抽出した差分値を予め定めた閾値と比較し、該閾値より小さい場合は、該2つの段落を統合する
ことを特徴とする情報処理装置。 - 前記電子文書内の画素塊を囲む矩形に関する情報として、該画素塊を囲む矩形の高さ又は幅方向の位置を含み、
前記ライン抽出手段は、前記画素塊の矩形の高さ又は幅方向の位置を用いて、該画素塊を含むラインである各行の高さ又は各列の幅を抽出する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記段落抽出手段は、前記ライン抽出手段によって抽出されたラインである各行の高さ又は各列の幅、及び該ラインの高さ又は幅方向の位置を用いて段落を抽出する
ことを特徴とする請求項1又は2に記載の情報処理装置。 - 前記段落抽出手段は、前記ライン抽出手段によって抽出されたラインと、処理対象としている段落との位置関係に基づいて段落を抽出する
ことを特徴とする請求項1から3のいずれか一項に記載の情報処理装置。 - 前記段落抽出手段は、抽出した段落に関する情報として、該段落を囲む外接矩形の位置に関する情報を算出する
ことを特徴とする請求項1から4のいずれか一項に記載の情報処理装置。 - 前記矩形算出手段は、前記段落統合手段によって統合された段落内で、ラインである行の高さ又は列の幅を統一し、画素塊間に隙間が生じないように、該統合された段落内の画素塊を囲む矩形の位置及び大きさを算出する
ことを特徴とする請求項1から5のいずれか一項に記載の情報処理装置。 - 前記矩形算出手段は、前記電子文書内に同等の形状の画素塊がある場合には、該画素塊を囲む矩形の位置及び大きさを同等の値とする
ことを特徴とする請求項1から6のいずれか一項に記載の情報処理装置。 - 前記矩形算出手段は、前記電子文書内の文字の言語の種類に基づいて、前記画素塊を囲む矩形の幅と高さが等しくなるように大きさを設定する
ことを特徴とする請求項1から7のいずれか一項に記載の情報処理装置。 - コンピュータを、
電子文書内の画素塊を囲む矩形に関する情報を用いて、該電子文書内の行又は列であるラインを抽出するライン抽出手段と、
前記ライン抽出手段によって抽出されたラインに応じて、前記電子文書内の段落を抽出する段落抽出手段と、
前記段落抽出手段によって抽出された段落を統合する段落統合手段と、
前記段落統合手段で統合された段落中のラインである行の高さ又は列の幅、及びラインを構成する画素塊間の間隔に基づいて、該統合された段落内の画素塊を囲む矩形の位置及び大きさを算出する矩形算出手段
として機能させ、
前記段落抽出手段は、抽出した段落に関する情報として、該段落に含まれるラインである各行の高さ又は各列の幅を用いて、該段落の代表値を算出し、
前記段落統合手段は、前記段落抽出手段で抽出された段落の代表値を用いて段落を統合し、
前記段落抽出手段が算出する前記代表値は、段落内の最も大きい行高さ、又は、段落内の最も大きい列幅であり、
前記段落統合手段は、段落間の代表値の差分値を算出し、該差分値が最小となる2つの段落を抽出し、該抽出した差分値を予め定めた閾値と比較し、該閾値より小さい場合は、該2つの段落を統合する
ことを特徴とする情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008185451A JP5062076B2 (ja) | 2008-07-17 | 2008-07-17 | 情報処理装置及び情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008185451A JP5062076B2 (ja) | 2008-07-17 | 2008-07-17 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010026667A JP2010026667A (ja) | 2010-02-04 |
JP5062076B2 true JP5062076B2 (ja) | 2012-10-31 |
Family
ID=41732464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008185451A Expired - Fee Related JP5062076B2 (ja) | 2008-07-17 | 2008-07-17 | 情報処理装置及び情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5062076B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013239203A (ja) * | 2013-08-05 | 2013-11-28 | Toshiba Corp | 電子機器、方法、及びプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62165275A (ja) * | 1986-01-17 | 1987-07-21 | Hitachi Ltd | 文書画像フアイル装置 |
JP2623844B2 (ja) * | 1989-07-31 | 1997-06-25 | 日本電気株式会社 | 文字行抽出装置 |
JPH0424757A (ja) * | 1990-05-15 | 1992-01-28 | Canon Inc | 文書処理装置 |
JPH07168910A (ja) * | 1993-10-19 | 1995-07-04 | N T T Data Tsushin Kk | 文書レイアウト解析装置及び文書フォ−マット識別装置 |
JPH08329190A (ja) * | 1995-03-24 | 1996-12-13 | Fuji Xerox Co Ltd | 文字認識装置 |
JP2006099480A (ja) * | 2004-09-29 | 2006-04-13 | Toshiba Corp | 文書処理装置 |
-
2008
- 2008-07-17 JP JP2008185451A patent/JP5062076B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010026667A (ja) | 2010-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5321109B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5663866B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP4539756B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4623169B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
JP4626777B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6221220B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5062076B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP4706764B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2002232679A (ja) | 画像処理方法及び装置及びコンピュータプログラム及び記憶媒体 | |
JP2012175220A (ja) | 画像処理装置及び画像処理プログラム | |
JP4900271B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5923981B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2010102734A (ja) | 画像処理装置及びプログラム | |
JP6682827B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6003375B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5949248B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6241311B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2011065311A (ja) | 画像処理装置及び画像処理プログラム | |
JP5531661B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2011100252A (ja) | 画像処理装置及び画像処理プログラム | |
JP6606885B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6409423B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5434272B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2005190439A (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120710 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120723 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5062076 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150817 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |