JP2008199249A - 画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラム - Google Patents
画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラム Download PDFInfo
- Publication number
- JP2008199249A JP2008199249A JP2007031600A JP2007031600A JP2008199249A JP 2008199249 A JP2008199249 A JP 2008199249A JP 2007031600 A JP2007031600 A JP 2007031600A JP 2007031600 A JP2007031600 A JP 2007031600A JP 2008199249 A JP2008199249 A JP 2008199249A
- Authority
- JP
- Japan
- Prior art keywords
- font
- image
- character
- shape
- representative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】画像処理装置の領域抽出手段は入力画像から同等の形状である領域を抽出し、代表形状生成手段は前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成し、フォント画像生成手段はフォントの画像を生成し、比較手段は前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較する。
【選択図】図1
Description
しかしながら、より高効率の圧縮率が求められており、MMRやJBIGなどのような画像圧縮方式での圧縮率では、その要望に応えられていない。
そこで、文字画像を文字コードに変換して圧縮する方式が提案されている。これに関連する技術として、例えば、特許文献1には、画像データ中の文字画像データを文字フォントと比較し、文字フォントに置換し、画像データと文字画像データをそれぞれ分離して圧縮することにより、画像データの圧縮率の向上、画質の向上を図ることを目的として、画像データの入力部と、文字画像データの有無を判断する文字画像認識部と、画像データと文字画像データとを分離する文字画像分離部と、文字画像データを圧縮する文字列圧縮部と、画像データを圧縮する画像圧縮部と、圧縮された文字画像データと画像データとを1つのデータにする合成部と、以上の動作を制御する制御部と、合成部で1つにまとめられたデータを再び文字画像データと画像データに分割する分割部と、文字画像データを伸長する文字列伸長部と、画像データを伸長する画像伸長部と、伸長された文字画像データと画像データとを表示する表示部とを有し、画像データ中から文字画像データを文字フォントとして分離して圧縮し、文字フォントで文字を表示することが記載されている。
また、例えば、特許文献2には、文字部分の符号化情報量を大幅に削減し、画像の圧縮率を飛躍的に向上させることを課題とし、まず、入力画像に対して文字領域抽出部において文字領域が抽出され、文字領域の画素値は文字認識部において文字部分がベクトル化され、文字として認識され、その結果、文字コードが出力され、文字コードに対応する各種フォントがフォントデータベースから検索され、それらが文字領域の画像と共に文字マッチング部に入力され、文字マッチング部では、文字領域の画素に最もよく近似するフォントの種類、文字のサイズ、文字の色が探索される。これらのデータと共に、文字部分の開始位置、文字間隔、文字コードが符号化データとして出力されることが記載されている。つまり、特許文献2に開示の技術は、入力画像中の文字領域を抽出し、文字認識を行い、文字コード化し、その文字コードに対応する各種文字フォントのうち、前記文字領域に最も近いフォントを探索し、そのパラメーターを符号化するものである。そして、復号時には、同一フォントデータベースを利用して、文字画像生成を行うものである。
また、非特許文献1には、JBIG2についてが開示されている。
また、非特許文献2には、文字の抽出方法に関する技術が開示されている。
[1] 入力画像から同等の形状である領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較する比較手段
を具備することを特徴とする画像処理装置。
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
を具備し、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする[1]に記載の画像処理装置。
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較して、類似するフォント画像を選択するフォント選択手段と、
前記フォント選択手段によって選択されたフォント画像を符号化する符号化手段
を具備することを特徴とする画像符号化装置。
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
を具備し、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする[3]に記載の画像符号化装置。
ことを特徴とする[3]又は[4]に記載の画像符号化装置。
前記符号化手段は、前記フォント選択手段によって選択されたフォント種を符号化する
ことを特徴とする[3]又は[4]に記載の画像符号化装置。
前記文字認識手段による認識結果である文字コードを符号化する文字コード符号化手段
を具備することを特徴とする[4]に記載の画像符号化装置。
入力画像から同等の形状である領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較する比較手段
として機能させることを特徴とする画像処理プログラム。
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
として機能させ、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする[8]に記載の画像処理プログラム。
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較して、類似するフォント画像を選択するフォント選択手段と、
前記フォント選択手段によって選択されたフォント画像を符号化する符号化手段
として機能させることを特徴とする画像符号化プログラム。
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
として機能させ、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする[10]に記載の画像符号化プログラム。
ことを特徴とする[10]又は[11]に記載の画像符号化プログラム。
前記符号化手段は、前記フォント選択手段によって選択されたフォント種を符号化する
ことを特徴とする[10]又は[11]に記載の画像符号化プログラム。
前記文字認識手段による認識結果である文字コードを符号化する文字コード符号化手段
として機能させることを特徴とする[11]に記載の画像符号化プログラム。
特許文献2のような従来の手法では、入力画像に対して、文字認識、及び、フォント画像との比較を、以下の回数行う必要がある。
文字数×フォントサイズ×フォント種×(その他、ボールド、イタリックなどの強調の種類等)
となる。上記のように、各文字に対して比較を行わなければならないため、比較の回数が膨大である。
文字コードで符号化を行うため、符号化器と復号器で同一のフォントデータベースを持つ必要がある。そのため、符号化器と復号器でフォントデータベースを同一とするためのコストが大きい。例えば、符号化器側でフォントデータを変更する場合には、変更後のフォントデータを復号器に伝送する必要がある。
あるいは、符号化器と復号器で異なるフォントデータベースを持ってもよいが、その場合には符号化器側で想定した画像と異なる画像が復号器で生成されてしまうことがある。
さらに、復号器で必要とするフォント画像のデータ量は、符号化された文字コード分だけでよいはずであるのにも関わらず、全てのフォント画像のデータを復号器で有していなければならない。すなわち、復号器のフォントデータベースの大半が無駄となってしまっている。
従来例では、入力文字画像N1に対して、フォント画像F1とフォント画像F2との対応をとって、近い方を選択する。図14では、入力文字画像N1に最も近いフォント画像はフォント画像F1であるため、入力文字画像N1に対してはフォント画像F1が選択される。同様に、入力文字画像N2に最も近いフォント画像はフォント画像F2であるため、入力文字画像N2に対してはフォント画像F2が選択される。このような場合、非常に似ているはずの入力文字画像N1と入力文字画像N2が全く異なるフォントに変換される危険性があり、圧縮文字品質が著しく損なわれるという問題点がある。
(1)各文字に対して文字認識、及び、フォント画像との対応をとる処理負荷が大きい。
(2)符号化器と復号器でフォントデータベースを共通化させるコストが大きい。また、復号器が持つフォントデータベース内の大半が無用なものとなっている。
(3)同一フォントであるべき画像が別フォントとなってしまい、画質劣化となる。
以下、JBIG2のテキストリージョン符号化方式の概要を示す。
(1)まず、入力画像の中から、同一文字とみなせる領域を抽出する。
例えば、入力画像中にあるフォント、あるサイズの文字「a」が複数存在するとする。この文字「a」の複数の領域(つまり、「a」という文字が出現している画像領域)を抽出する。この複数の領域中の文字「a」はほぼ同じ形状を持つものである。
文字の抽出方法としては、例えば、非特許文献2にその方法が記載されている。連結する画素を抜き出し、抜き出した連結成分のテンプレートマッチングを行う方法である。
(2)上記の同一文字とみなせる領域を用いて、代表文字形状を作成する。
(3)代表文字形状に番号(以下、文字番号とする)を付与する。
(4)各文字の文字番号と、文字の位置と、代表文字形状を符号化する。
上記のJBIG2のテキストリージョン符号化方式によって符号化されたものを復号する場合には、文字番号と、代表文字形状と、文字の位置を用いて各文字を復元する。
符号化の処理について述べる。
(1)まず、入力画像の中から、同一文字とみなせる領域を抽出する。これはJBIG2のテキストリージョン符号化時に用いられるものと同等の処理を行えばよい。
(2)上記の同一文字とみなせる領域を用いて、代表文字形状を作成する。これも、JBIG2のテキストリージョン符号化時に用いられるものと同等の処理を行えばよい。
(3)代表文字形状に番号(以下、文字番号とする)を付与する。
(4)上記代表文字形状に対して、文字認識を行う。
(5)上記認識結果と、フォントデータベースを用いて、代表文字形状と最も似通ったフォントを選択する。
(6)代表文字形状を、上記最も似通ったフォント画像に入れ替える。
(7)各文字の文字番号と、文字の位置と、代表文字形状(フォント画像)を符号化する。
(1)文字認識や、フォント画像とのマッチングは、代表文字形状に対してのみ行えばよいため、処理負荷が格段に減少する。
(2)最初に同一文字領域の抽出を行うため、似通った文字は同じフォントの画像とすることができる。
(3)フォント画像で作成した代表文字形状を符号化するため、復号器にフォントデータベースが不要である。そのため、
(3−1)符号化器でフォントデータベースを変更しても、復号器にそれを反映させる必要が無い。
(3−2)復号器で、フォントデータベースを有する必要が無い。
(3−3)JBIG2の復号器で復号可能なように符号を形成することが可能となる。
ただし、上記に示す効果は、特許請求の範囲に記載した発明全体にわたる効果ではないことに注意されたい。特許請求の範囲に記載した発明としては、上記で示した概要のサブセットとなるものもあるため、必ずしも全ての効果を有するものではない。なお、このただし書きは、例えば、復号器にフォントデータベースを有している形態も、本発明に含まれる態様であるために、記載している。
上記では、JBIG2を例として示したが、JBIG2符号化を行う必要は全く無い。ただし、JBIG2符号ストリーム化することによって、標準JBIG2復号器を用いて画像を生成できるというメリットがある。
図1〜図4は、第1の実施の形態を説明する図面である。図1、図2は、第1の実施の形態の概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはプログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、プログラム、システム及び方法の説明をも兼ねている。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示等)を含む。
また、システムとは、複数のコンピュータ、ハードウェア、装置等がネットワーク等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。
以下、JBIG2の符号を生成する場合を用いて説明する。
代表文字形状生成モジュール13は、図1に示すように、同一文字領域抽出モジュール11、文字認識モジュール14、文字マッチングモジュール16と接続されており、同一文字領域抽出モジュール11によって抽出された同等の形状である領域に基づいて、その領域を代表する形状である代表文字形状を生成し、その代表文字形状の画像データを文字認識モジュール14と文字マッチングモジュール16へ渡す。
すなわち、同じ文字と認められた(一つあるいは複数の)領域を用いて、一つの代表文字形状を生成する。例えば、同じ文字と考えられる複数の領域の文字の重心を合わせた後、その平均値を用いて代表文字形状を生成するなどすればよい。また、同一文字領域抽出モジュール11によって抽出した領域の一つを選択するようにしてもよい。ここで生成された代表文字形状には、その形状と文字番号をリンクさせておく。つまり、文字番号を用いて代表文字形状の画像データを検索可能としておく。
さらに、代表文字形状生成モジュール13による代表文字形状生成方法としては、特開2005−301663号公報に開示されている方法を用いることもできる。又は、代表文字形状生成方法としては、同一文字コードとなった画像の中から一つを選択するだけでもよい。選択方法としては、ランダムに選んでもよいし、最初に出現した画像を選んでもよいし、あるいは、他の画像との距離が最も小さくなるような画像を選んでもよい。ここで、距離とは、例えば、画像を2値として、画像のXOR(排他的論理和)をとった時の総和を用いることができる。
フォントデータベース15は、図1に示すように、文字認識モジュール14、文字マッチングモジュール16と接続されており、文字コードに対応する各種フォントが格納されている。そして、文字認識モジュール14による認識結果である文字コードに基づいて、その文字コードに対応する複数のフォント画像を文字マッチングモジュール16に出力する。例えば、フォントデータベース15に明朝体とゴシック体が蓄えられているとすると、認識結果である文字コードに対応した明朝体とゴシック体のフォント画像が文字マッチングモジュール16に渡される。
なお、複数のフォント画像は、文字認識モジュール14による文字認識で得られた文字コードに対して、複数のフォント種、複数のサイズ(ポイント)、複数の強調(イタリック、ボールドなど)、複数のスキュー角(傾き)、複数の解像度で作成されている。複数の解像度のフォント画像は、文字のポイント数と、画素の大きさとの相対的な大きさを変えて文字を描画することによって得ることができる。これは、同じ文字であっても、相対的に画素が大きな時には、違った文字形状が描画されるため、これに対応できるようにするためである。
代表文字形状符号化モジュール17は、図1に示すように、文字マッチングモジュール16と接続されており、最も類似したフォント画像を符号化する。もしくは、複数のフォント画像の中に代表文字形状に似た画像が存在しない場合は、代表文字形状生成モジュール13で生成された代表文字形状をそのまま符号化する。ここでは、代表文字形状と文字番号とのリンク情報も符号化する。そして、その符号を外部へ送信する。
ステップS302では、同一文字領域抽出モジュール11が入力画像から同等の形状の領域を抽出する。
ステップS304では、代表文字形状生成モジュール13が、ステップS302で抽出された複数の領域を基にして、代表の文字形状を生成する。
ステップS306では、文字認識モジュール14が、ステップS304で生成された代表文字形状を文字認識する。
ステップS310では、文字マッチングモジュール16が、ステップS304で生成された代表文字形状とステップS308で生成されたフォント画像とのマッチング処理を行い、最も類似したフォント画像を選択する。
ステップS312では、代表文字形状符号化モジュール17が、ステップS310で選択したフォント画像を符号化する。
ステップS316では、ステップS302で抽出された全ての領域に対して、ステップS304からステップS314の処理が終了したか否かを判断する。終了していなければ、ステップS304へ戻り、終了していれば、入力画像に対しての符号化は終了したことになる(ステップS318)。
文字番号、文字位置復号モジュール21は、図2に示すように、文字復号モジュール23と接続されており、第1の実施の形態の符号化装置の文字番号、文字位置符号化モジュール12で符号化された各文字の文字番号と文字位置を復号する。復号後の文字番号と文字位置を文字復号モジュール23へ渡す。
文字復号モジュール23は、図2に示すように、文字番号、文字位置復号モジュール21、代表文字形状復号モジュール22と接続されており、各文字位置に文字番号から得られる代表文字形状を貼り付けて、文字を復号する。つまり、第1の実施の形態の符号化装置の同一文字領域抽出モジュール11が入力した画像を生成することになる。
なお、上記復号装置は、JBIG2のテキストリージョン復号装置であってもよい。
ステップS402では、文字番号、文字位置復号モジュール21が、入力された符号から文字番号と文字位置を復号する。
ステップS404では、代表文字形状復号モジュール22が、入力された符号から代表文字形状、そして代表文字形状と文字番号とのリンク情報を復号する。
ステップS406では、文字復号モジュール23が、ステップS402で復号された文字番号と文字位置、ステップS404で復号された代表文字形状、そして代表文字形状と文字番号とのリンク情報に基づいて、文字の復号(つまり、画像への貼り付け)を行う。
ステップS408では、入力されてくる符号の全ての復号が終了したか否かを判断する。終了していなければ、ステップS402へ戻り、終了していれば、復号は終了したことになる(ステップS410)。
なお、第1の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
第1の実施の形態の符号化装置では、代表文字形状符号化モジュール17は、代表文字形状として、フォント画像をそのまま符号化して送ったが、フォント画像を送る必要は必ずしもなく、フォント画像生成情報を送ればよい。フォント画像生成情報、つまりベクタフォントであれば、ベクタ情報を送ればよい。PDF(Portable Document Format)(登録商標)でフォント情報を含んだファイル生成方法があるが、それと同じ方式をとることができる。
第2の実施の形態である符号化装置は、第1の実施の形態の符号化装置の代表文字形状符号化モジュール17の代わりにフォント生成情報符号化モジュール57としたものである。残りのモジュールは第1の実施の形態の符号化装置と同様である。
フォント生成情報符号化モジュール57は、図5に示すように、文字マッチングモジュール16と接続されており、文字マッチングモジュール16によって選択されたフォント画像を生成する情報であるフォント画像生成情報、そしてフォント画像生成情報と文字番号とのリンク情報を符号化する。なお、フォント画像生成情報は、フォントデータベース15に記憶されていてもよく、文字マッチングモジュール16はフォント画像生成情報を用いて、マッチングするフォント画像を生成するようにしてもよい。
代表文字形状と一致するフォント画像が無い場合には、第1の実施の形態の符号化装置と同様に代表文字形状符号化モジュール17を用いて、別途代表文字形状を符号化すればよい。
フォント生成情報量が小さいと判断した場合には、符号化を行わないようにしてもよい。
ステップS702からステップS710までの処理は、図3で示したステップS302からステップS310までの処理と同様である。
ステップS712では、フォント生成情報符号化モジュール57が、ステップS710で選択したフォント画像のフォント画像生成情報を符号化する。
ステップS714からステップS718までの処理は、図3で示したステップS314からステップS318までの処理と同様である。
第2の実施の形態である復号装置は、第1の実施の形態の復号装置の代表文字形状復号モジュール22の代わりにフォント生成情報復号フォント画像生成モジュール62としたものである。残りのモジュールは第1の実施の形態の復号装置と同様である。
フォント生成情報復号フォント画像生成モジュール62は、図6に示すように、文字復号モジュール23と接続されており、第2の実施の形態の符号化装置のフォント生成情報符号化モジュール57で符号化されたフォント画像生成情報、そしてフォント画像生成情報と文字番号とのリンク情報を復号する。復号後のフォント画像生成情報からフォント画像を生成し、そして、フォント画像、フォント画像生成情報と文字番号とのリンク情報を文字復号モジュール23へ渡す。
ステップS802の処理は、図4で示したステップS402の処理と同様である。
ステップS804では、フォント生成情報復号フォント画像生成モジュール62が、入力された符号からフォント画像生成情報、そしてフォント画像生成情報と文字番号とのリンク情報を復号する。
ステップS806では、フォント生成情報復号フォント画像生成モジュール62が、フォント画像生成情報からフォント画像を生成する。
ステップS808、ステップS810の処理は、図4で示したステップS406、ステップS408の処理と同様である。
なお、第1の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
第3の実施の形態である符号化装置は、図9に示すように、同一文字領域抽出モジュール11、文字コード、文字位置符号化モジュール92、代表文字形状生成モジュール13、文字認識モジュール14、フォントデータベース15、文字マッチングモジュール16、フォント種符号化モジュール97を有している。
第3の実施の形態である符号化装置は、第1の実施の形態の符号化装置の代表文字形状符号化モジュール17の代わりにフォント種符号化モジュール97、文字番号、文字位置符号化モジュール12の代わりに文字コード、文字位置符号化モジュール92としたものである。残りのモジュールは第1の実施の形態の符号化装置と同様である。
第3の実施の形態のフォント種符号化モジュール97は、図9に示すように、文字マッチングモジュール16と接続されており、文字マッチングモジュール16による文字のマッチング処理の結果、フォント種(フォント種、フォントサイズや強調の種類など)を得てそれを符号化する。
代表文字形状と一致するフォント画像が無い場合には、第1の実施の形態の符号化装置と同様に代表文字形状符号化モジュール17を用いて、別途代表文字形状を符号化すればよい。
フォント種のデータ量が小さいと判断した場合には、符号化を行わないようにしてもよい。
ステップS1102からステップS1110までの処理、ステップS1116の処理は、図3で示したステップS302からステップS310までの処理、ステップS316の処理と同様である。
ステップS1112では、フォント種符号化モジュール97が、ステップS1110で選択したフォントのフォント種を符号化する。
ステップS1114では、文字コード、文字位置符号化モジュール92が、ステップS1106で得た文字認識結果である文字コードとステップS1102で抽出されたその文字の位置を符号化する。
フォント種復号モジュール101は、図10に示すように、フォントデータベース・フォント画像生成モジュール103と接続されており、第3の実施の形態の符号化装置のフォント種符号化モジュール97で符号化されたフォント種を復号する。復号後のフォント種をフォントデータベース・フォント画像生成モジュール103へ渡す。
文字コード、文字位置復号モジュール102は、図10に示すように、フォントデータベース・フォント画像生成モジュール103、文字復号モジュール104と接続されており、第3の実施の形態の符号化装置の文字コード、文字位置符号化モジュール92で符号化された各文字の文字コードと文字位置を復号する。復号後の文字コードをフォントデータベース・フォント画像生成モジュール103へ渡し、文字位置を文字復号モジュール104へ渡す。
フォントデータベース・フォント画像生成モジュール103は、図10に示すように、フォント種復号モジュール101、文字コード、文字位置復号モジュール102、文字復号モジュール104と接続されており、フォント種復号モジュール101からのフォント種と文字コード、文字位置復号モジュール102からの文字コードからフォントデータベースにより該当するフォント画像を生成する。生成したフォント画像を文字復号モジュール104へ渡す。
文字復号モジュール104は、図10に示すように、文字コード、文字位置復号モジュール102、フォントデータベース・フォント画像生成モジュール103と接続されており、文字コード、文字位置復号モジュール102からの文字位置に、フォントデータベース・フォント画像生成モジュール103からのフォント画像を貼り付けて文字を復号する。つまり、第3の実施の形態の符号化装置の同一文字領域抽出モジュール11が入力した画像を生成することになる。
ステップS1202では、フォント種復号モジュール101が、入力された符号からフォント種を復号する。
ステップS1204では、文字コード、文字位置復号モジュール102が、入力された符号から文字コードと文字位置を復号する。
ステップS1206では、フォントデータベース・フォント画像生成モジュール103が、ステップS1202で復号されたフォント種及びステップS1204で復号された文字コードを用いて、フォント画像を生成する。
ステップS1208では、文字復号モジュール104が、ステップS1206で生成したフォント画像をステップS1204で復号した文字位置に貼り付けて、文字を復号する。
ステップS1210では、入力されてくる符号の全ての復号が終了したか否かを判断する。終了していなければ、ステップS1202へ戻り、終了していれば、復号は終了したことになる(ステップS1212)。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、上記のプログラム又はその一部は、上記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにはこれらの組合せ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、上記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
12…文字番号、文字位置符号化モジュール
13…代表文字形状生成モジュール
14…文字認識モジュール
15…フォントデータベース
16…文字マッチングモジュール
17…代表文字形状符号化モジュール
21…文字番号、文字位置復号モジュール
22…代表文字形状復号モジュール
23…文字復号モジュール
57…フォント生成情報符号化モジュール
62…フォント生成情報復号フォント画像生成モジュール
92…文字コード、文字位置符号化モジュール
97…フォント種符号化モジュール
101…フォント種復号モジュール
102…文字コード、文字位置復号モジュール
103…フォントデータベース・フォント画像生成モジュール
104…文字復号モジュール
Claims (14)
- 入力画像から同等の形状である領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較する比較手段
を具備することを特徴とする画像処理装置。 - さらに、
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
を具備し、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする請求項1に記載の画像処理装置。 - 入力画像から同等の形状である領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較して、類似するフォント画像を選択するフォント選択手段と、
前記フォント選択手段によって選択されたフォント画像を符号化する符号化手段
を具備することを特徴とする画像符号化装置。 - さらに、
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
を具備し、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする請求項3に記載の画像符号化装置。 - 前記符号化手段は、前記フォント選択手段によって選択されたフォント画像を生成する情報であるフォント画像生成情報を符号化する
ことを特徴とする請求項3又は4に記載の画像符号化装置。 - 前記フォント選択手段は、前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較して、フォントの種類であるフォント種を選択し、
前記符号化手段は、前記フォント選択手段によって選択されたフォント種を符号化する
ことを特徴とする請求項3又は4に記載の画像符号化装置。 - さらに、
前記文字認識手段による認識結果である文字コードを符号化する文字コード符号化手段
を具備することを特徴とする請求項4に記載の画像符号化装置。 - コンピュータを、
入力画像から同等の形状である領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較する比較手段
として機能させることを特徴とする画像処理プログラム。 - さらに、前記コンピュータを、
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
として機能させ、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする請求項8に記載の画像処理プログラム。 - 入力画像から同等の形状である領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較して、類似するフォント画像を選択するフォント選択手段と、
前記フォント選択手段によって選択されたフォント画像を符号化する符号化手段
として機能させることを特徴とする画像符号化プログラム。 - さらに、前記コンピュータを、
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
として機能させ、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする請求項10に記載の画像符号化プログラム。 - 前記符号化手段は、前記フォント選択手段によって選択されたフォント画像を生成する情報であるフォント画像生成情報を符号化する
ことを特徴とする請求項10又は11に記載の画像符号化プログラム。 - 前記フォント選択手段は、前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較して、フォントの種類であるフォント種を選択し、
前記符号化手段は、前記フォント選択手段によって選択されたフォント種を符号化する
ことを特徴とする請求項10又は11に記載の画像符号化プログラム。 - さらに、前記コンピュータを、
前記文字認識手段による認識結果である文字コードを符号化する文字コード符号化手段
として機能させることを特徴とする請求項11に記載の画像符号化プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007031600A JP2008199249A (ja) | 2007-02-13 | 2007-02-13 | 画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007031600A JP2008199249A (ja) | 2007-02-13 | 2007-02-13 | 画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008199249A true JP2008199249A (ja) | 2008-08-28 |
Family
ID=39757813
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007031600A Pending JP2008199249A (ja) | 2007-02-13 | 2007-02-13 | 画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008199249A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016009395A (ja) * | 2014-06-25 | 2016-01-18 | 京セラドキュメントソリューションズ株式会社 | 文書ファイル生成装置及び文書ファイル生成方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05328147A (ja) * | 1992-05-11 | 1993-12-10 | Nec Corp | 文字画像データ分離圧縮方式 |
JPH10178638A (ja) * | 1996-12-18 | 1998-06-30 | Nippon Telegr & Teleph Corp <Ntt> | 文字領域符号化方法、復号方法、文字領域符号化装置および復号装置 |
JP2004334339A (ja) * | 2003-04-30 | 2004-11-25 | Canon Inc | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム |
JP2005151455A (ja) * | 2003-11-19 | 2005-06-09 | Canon Inc | 画像処理装置、情報処理装置及びそれらの制御方法、プログラム |
JP2005301663A (ja) * | 2004-04-12 | 2005-10-27 | Fuji Xerox Co Ltd | 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム |
-
2007
- 2007-02-13 JP JP2007031600A patent/JP2008199249A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05328147A (ja) * | 1992-05-11 | 1993-12-10 | Nec Corp | 文字画像データ分離圧縮方式 |
JPH10178638A (ja) * | 1996-12-18 | 1998-06-30 | Nippon Telegr & Teleph Corp <Ntt> | 文字領域符号化方法、復号方法、文字領域符号化装置および復号装置 |
JP2004334339A (ja) * | 2003-04-30 | 2004-11-25 | Canon Inc | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム |
JP2005151455A (ja) * | 2003-11-19 | 2005-06-09 | Canon Inc | 画像処理装置、情報処理装置及びそれらの制御方法、プログラム |
JP2005301663A (ja) * | 2004-04-12 | 2005-10-27 | Fuji Xerox Co Ltd | 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016009395A (ja) * | 2014-06-25 | 2016-01-18 | 京セラドキュメントソリューションズ株式会社 | 文書ファイル生成装置及び文書ファイル生成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4600491B2 (ja) | 画像処理装置及び画像処理プログラム | |
US8411955B2 (en) | Image processing apparatus, image processing method and computer-readable medium | |
JP4766030B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4364809B2 (ja) | 画像処理装置、画像処理方法、プログラム、及び記録媒体 | |
JPH11168632A (ja) | ディザ画像の2値表現処理方法、ディザ画像の圧縮2値表現圧縮解除方法、及びディザ画像の圧縮及び圧縮解除システム | |
JP4633576B2 (ja) | データ圧縮装置およびデータ圧縮プログラム | |
US7362904B2 (en) | Image processing device, image forming apparatus, program, and storing medium | |
JP2008199249A (ja) | 画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラム | |
JP5842357B2 (ja) | 画像処理装置及び画像処理プログラム | |
CN105704215A (zh) | 文件共享系统及相应的文件发送、接收方法及装置 | |
JP3854849B2 (ja) | データ伸長処理方法およびデータ伸長処理装置 | |
JP2005252531A (ja) | データ圧縮装置およびデータ圧縮プログラム | |
JP4748805B2 (ja) | 画像符号化装置及びその制御方法 | |
JP2011004302A (ja) | 画像処理装置及び画像処理プログラム | |
JP4930288B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4872780B2 (ja) | 画像処理システム及び画像処理プログラム | |
JP5526596B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6481301B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6569242B2 (ja) | 画像処理装置、画像処理システム及び画像処理プログラム | |
JP4650958B2 (ja) | 画像処理装置、方法およびプログラム | |
JP2007059999A (ja) | データ圧縮装置およびデータ圧縮プログラム | |
JP3796235B2 (ja) | イメージ圧縮及び復元方法 | |
JP2005210539A (ja) | データ圧縮装置およびデータ圧縮プログラム | |
JP2005260420A (ja) | データ圧縮装置およびデータ圧縮プログラム | |
JP2006352548A (ja) | データ圧縮装置およびデータ圧縮プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110223 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110425 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110524 |