JP4645058B2 - 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム - Google Patents
画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム Download PDFInfo
- Publication number
- JP4645058B2 JP4645058B2 JP2004116646A JP2004116646A JP4645058B2 JP 4645058 B2 JP4645058 B2 JP 4645058B2 JP 2004116646 A JP2004116646 A JP 2004116646A JP 2004116646 A JP2004116646 A JP 2004116646A JP 4645058 B2 JP4645058 B2 JP 4645058B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- template
- pattern
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Description
上記目的を達成するために、本発明にかかる画像辞書作成装置は、文字コードに対応付けられた類型的な文字画像をテンプレート画像として複数提供するテンプレート提供手段と、入力画像に含まれる文字画像と、前記テンプレート提供手段により提供される複数のテンプレート画像との一致度合いを判定する一致判定手段と、前記一致判定手段により判定された一致度合いに基づいて、前記テンプレート提供手段により提供される複数のテンプレート画像から、入力画像に含まれる文字画像それぞれに対応するテンプレート画像を選択する選択手段と、前記選択手段により選択されたテンプレート画像それぞれを、当該テンプレート画像に対応する文字画像の文字コードに基づいて分類する文字分類手段と、前記文字分類手段により同一の文字コードに分類されたテンプレート画像それぞれの出現頻度に応じて、当該テンプレート画像の画素の分布を示す画素分布に対し、予め定められた閾値以下の分布数を除去する閾値処理を施した後、この入力画像において類型的な画像パターンを決定する類型決定手段と、前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段とを有する。
また、本発明にかかる符号化装置は、文字コードに対応付けられた類型的な文字画像をテンプレート画像として複数提供するテンプレート提供手段と、入力画像に含まれる文字画像と、前記テンプレート提供手段により提供される複数のテンプレート画像との一致度合いを判定する一致判定手段と、前記一致判定手段により判定された一致度合いに基づいて、前記テンプレート提供手段により提供される複数のテンプレート画像から、入力画像に含まれる文字画像それぞれに対応するテンプレート画像を選択する選択手段と、前記選択手段により選択されたテンプレート画像それぞれを、当該テンプレート画像に対応する文字画像の文字コードに基づいて分類する文字分類手段と、前記文字分類手段により同一の文字コードに分類されたテンプレート画像それぞれの出現頻度に応じて、当該テンプレート画像の画素の分布を示す画素分布に対し、予め定められた閾値以下の分布数を除去する閾値処理を施した後、この入力画像において類型的な画像パターンを決定する類型決定手段と、前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と、入力画像に含まれている文字画像のデータを、この文字画像の入力画像における量言いを示す文字領域情報、及び、この文字画像に対応する画像パターンの識別情報と置換して符号化する符号化手段とを有する。
また、本発明にかかる画像辞書作成方法は、コンピュータを含む画像辞書作成装置において、コンピュータが、文字コードに対応付けられた類型的な文字画像をテンプレート画像として複数提供し、入力画像に含まれる文字画像と、提供される複数のテンプレート画像との一致度合いを判定し、判定された一致度合いに基づいて、提供される複数のテンプレート画像から、入力画像に含まれる文字画像それぞれに対応するテンプレート画像を選択し、選択されたテンプレート画像それぞれを、当該テンプレート画像に対応する文字画像の文字コードに基づいて分類し、同一の文字コードに分類されたテンプレート画像それぞれの出現頻度に応じて、当該テンプレート画像の画素の分布を示す画素分布に対し、予め定められた閾値以下の分布数を除去する閾値処理を施した後、この入力画像において類型的な画像パターンを決定し、決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する。
また、本発明にかかるプログラムは、コンピュータを含む画像辞書作成装置において、文字コードに対応付けられた類型的な文字画像をテンプレート画像として複数提供するステップと、入力画像に含まれる文字画像と、提供される複数のテンプレート画像との一致度合いを判定するステップと、判定された一致度合いに基づいて、提供される複数のテンプレート画像から、入力画像に含まれる文字画像それぞれに対応するテンプレート画像を選択するステップと、選択されたテンプレート画像それぞれを、当該テンプレート画像に対応する文字画像の文字コードに基づいて分類するステップと、同一の文字コードに分類されたテンプレート画像それぞれの出現頻度に応じて、当該テンプレート画像の画素の分布を示す画素分布に対し、予め定められた閾値以下の分布数を除去する閾値処理を施した後、この入力画像において類型的な画像パターンを決定するステップと、決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与するステップとを前記画像辞書作成装置のコンピュータに実行させる。
まず、本発明の理解を助けるために、その背景及び概略を説明する。
画像処理装置2は、例えば、入力画像に含まれる文字画像そのものを符号化する替わりに、それぞれの文字画像の識別情報とその出現位置等とを符号化することにより、高い圧縮率を実現することができる。
図1(A)は、共通のフォントデータベースが存在することを前提とした符号化方法を説明し、図1(B)は、画像辞書の添付を前提とした符号化方法を説明する図である。
図1(A)に示すように、文字画像を識別情報(文字コード及びフォントの種類)に対応付けて記憶する共通のフォントデータベースが符号化側及び復号化側の両方に存在する場合には、符号化側の画像処理装置は、文字画像の識別情報(文字コード及びフォントの種類等)と、文字画像の出現位置とを符号化することにより、高い圧縮率で画像データを圧縮し復号化側の画像処理装置に送信することができる。この場合に、復号化側の画像処理装置は、受信した符号データ(文字コード及びフォントの種類)を復号化し、復号化された文字コード及びフォントの種類、並びに、フォントデータベースに登録されているフォント画像に基づいて文字画像を生成する。
しかしながら、フォントデータベースの存在を前提とした符号化方法では、符号化側及び復号化側でフォントデータベースをそれぞれ設ける必要があり、記憶領域がフォントデータベースにより圧迫される。また、符号化側のフォントデータベースが更新されると、これに応じて復号化側のフォントデータベースも符号化側と同一内容になるよう更新する必要がある。
このように、画像処理装置2は、入力画像に応じて画像辞書を作成し送受信することにより、共通のデータベースを前提とすることなく高い圧縮率を実現することができる。また、フォントデータベースを符号化側及び復号化側で同期させる必要がない。なお、符号量を低減させるためには、画像辞書も符号化されることが望ましい。
図2(A)に例示するように、画像辞書には、入力画像に含まれる複数の画像パターンと、この画像パターンを識別するために付与されたインデクスとが含まれる。画像パターンは、入力画像に含まれる部分的な画像データであり、本例では入力画像(2値)中に既定回数以上(複数回)出現する類型的なパターン(2値データ)である。また、インデクスは、例えば、入力画像毎に個別に生成される識別情報であり、入力画像から画像パターンが抽出される順番でその画像パターンに付与されるシリアル番号等であってもよい。
文字画像よりもさらに小さな単位で画像パターンが抽出される場合には、それぞれの画像パターンの出現頻度が高い場合が多いが(例えば、「1」の縦棒部分は、「山」及び「川」の一部として出現する)、画像辞書に登録すべき画像パターンの数が多くなり画像辞書のデータ量が大きくなる。
一方、文字画像単位で画像パターンが抽出される場合には、同一ドキュメント内では、同一の言語で同一のフォント種類及び同一のフォントサイズの文字が多数出現するため、画像パターンのサイズが大きい割には高い出現頻度が期待できる。
また、ある程度の非可逆性を許容して高い圧縮率を目指す場合に、符号化側の画像処理装置は、画像パターンと同一の部分画像だけでなく、画像パターンと類似する部分画像もインデクスに置換して符号化する。この場合に、文字画像の構成部分それぞれが、類似する画像パターンに置換されると、文字画像全体として全く異なるものに復号化されて可読性を失う可能性もある。しかしながら、文字画像単位で画像パターンが抽出される場合には、文字画像の全体的な形状が類似する画像パターン(例えば、数字の「1」とアルファベットの「I」など)に置換されるため、ある程度可読性が維持される。
そこで、本実施形態における画像処理装置2は、文字画像単位の画像パターンを決定し、画像辞書に登録する。
また、本実施形態における画像処理装置2は、画像パターンのテンプレートとして、フォントデータベースに記憶されているフォント画像を適用して画像辞書を作成する。符号化対象となる入力画像には、フォント画像で構成された文字画像が多く、また、一定の手書き文字等がフォント画像に置換されたとしても可読性に影響を与えないからである。
さらには、本実施形態における画像処理装置2は、フォント画像に基づいて画像パターンを作成する。これにより、複写の繰返しによる画質劣化などが解消されて可読性が向上する。なお、本実施形態の画像処理装置2は、符号化処理においてフォント画像を用いるだけであり、復号化時にはフォントデータベースを用いる必要はない。
次に、画像処理装置2のハードウェア構成を説明する。
図3は、本発明にかかる画像辞書作成方法が適応される画像処理装置2のハードウェア構成を、制御装置20を中心に例示する図である。
図3に例示するように、画像処理装置2は、CPU202及びメモリ204などを含む制御装置20、通信装置22、HDD・CD装置などの記録装置24、並びに、LCD表示装置あるいはCRT表示装置およびキーボード・タッチパネルなどを含むユーザインターフェース装置(UI装置)26から構成される。
画像処理装置2は、例えば、符号化プログラム5(後述)がプリンタドライバの一部としてインストールされた汎用コンピュータであり、通信装置22又は記録装置24などを介して画像データを取得し、取得された画像データを符号化してプリンタ装置10に送信する。また、画像処理装置2は、プリンタ装置10のスキャナ機能より光学的に読み取られた画像データを取得し、取得された画像データを符号化する。
図4は、制御装置20(図3)により実行され、本発明にかかる画像辞書作成方法を実現する符号化プログラム5の機能構成を例示する図である。
図4に例示するように、符号化プログラム5は、画像入力部40、画像辞書作成部50及び符号化部60を有する。
符号化プログラム5において、画像入力部40は、プリンタ装置10のスキャナ機能により読み取られた画像データ、又は、通信装置22又は記録装置24などを介して取得されたPDL(Page Discription Language)形式の画像データを取得し、取得された画像データをラスタデータに変換して画像辞書作成部50に出力する。また、画像入力部40は、光学的に読み取られた画像データ等から文字画像を認識する文字認識部410と、PDL形式の画像データを解釈してラスタデータを生成するPDLデコンポーザ420とを有する。
文字認識部410は、入力された画像データ(以下、入力画像)に含まれる文字を認識し、認識された文字の文字識別情報、及び、認識された文字の文字領域情報を文字認識処理の結果として画像辞書作成部50に対して出力する。ここで、文字識別情報とは、文字を識別する情報であり、例えば、汎用性のある文字コード(ASCIIコード又はシフトJISコードなど)、又は、文字コードとフォントの種類との組合せなどである。また、文字領域情報とは、入力画像における文字画像の領域を示す情報であり、例えば、文字画像の位置、大きさ、範囲又はこれらの組合せからなる文字のレイアウト情報である。
PDLデコンポーザ420は、PDL形式の画像データを解釈してラスタライズされた画像データ(ラスタデータ)を生成し、生成された画像データと共に、生成された画像データにおける文字画像の文字識別情報及び文字領域情報を画像辞書作成部50に対して出力する。
図5に示すように、画像辞書作成部50は、記憶部500、文字画像抽出部510、フォント提供部520、フォントデータベース525(以下、フォントDB525)、一致判定部530、辞書決定部540、位置補正部550、インデクス付与部560及び登録制御部570を有する。記憶部500は、メモリ204(図3)及び記録装置24(図3)を制御して、画像入力部40(図4)から入力された入力画像、文字識別情報及び文字領域情報を記憶する。なお、以下、文字コードを文字識別情報の具体例とし、文字の位置情報を文字領域情報の具体例として説明する。
また、一致判定部530は、文字画像とフォント画像とを複数の相対位置で比較して一致度合いを判定する。すなわち、一致判定部530は、最大の一致度合いを算出するために、文字画像とフォント画像との相対位置を変更しながら(ずらしながら)比較する。
例えば、一致判定部530は、入力画像から切り出された文字画像と、この文字画像の文字コードに基づいて選択されたフォント画像とを互いにずらしながら一致画素率を算出し、一致画素率の最大値及びこの最大となったときのずらしベクトルを記憶部500に出力する。
また、一致判定部530は、同様に、入力画像から切り出された文字画像と、画像辞書に登録された画像パターンとを比較して、一致度合いを判定する。
インデクス付与部560は、フォント画像に基づいて決定された画像パターンに対して、これらの画像パターンを識別するインデクスを付与し、付与されたインデクスと画像パターンとを対応付けて記憶部500に出力する。
図6に示すように、符号化部60は、パターン判定部610、位置情報符号化部620、インデクス符号化部630、画像符号化部640、辞書符号化部650、選択部660及び符号出力部670を有する。
パターン判定部610は、画像辞書に登録された画像パターンそれぞれと、入力画像に含まれる部分画像とを比較して、この部分画像と対応する画像パターン(同一又は類似の画像パターン)を判定する。具体的には、パターン判定部610は、入力画像から文字画像単位で切り出された部分画像(位置補正部550により補正がなされたもの)と、画像パターンとを重ねあわせて、一致判定部530(図5)と同様の手法により、一致度合いを算出し、算出された一致度合いが基準値以上であるか否かに基づいて、対応しているか否かを判定する。
パターン判定部610は、対応する画像パターンが発見された場合には、この部分画像の位置情報を位置情報符号化部620に対して出力し、この画像パターンのインデクスをインデクス符号化部630に対して出力し、対応する画像パターンが発見されない場合には、この部分画像を画像符号化部640に対して出力する。
なお、本実施形態におけるパターン判定部610は、入力された文字画像と一致する画像パターン(すなわち、フォント画像)のインデクス、及び、文字画像の位置情報(位置補正部550により補正されたもの)を画像辞書作成部50から取得するため、入力された文字画像に対応するフォント画像がフォントDB525に存在する場合には、取得されたインデクス及び位置情報をそれぞれインデクス符号化部630及び位置情報符号化部620に出力し、入力された文字画像と対応するフォント画像が存在しない場合には、この文字画像そのものを画像符号化部640に出力する。
インデクス符号化部630は、パターン判定部610から入力されたインデクスを符号化し、選択部660に対して出力する。例えば、インデクス符号化部630は、インデクスの出現頻度に応じて符号長が異なる符号をそれぞれのインデクスに付与する。
画像符号化部640は、画像に適した符号化方式を適用して、パターン判定部610から入力された部分画像を符号化し、選択部660に対して出力する。
辞書符号化部650は、画像辞書作成部50(図4,図5)から入力された画像辞書(画像パターンとインデクスとが互いに対応付けられたもの)を符号化し、符号出力部670に対して出力する。
符号出力部670は、選択部660から入力された符号データ(位置情報、インデクス及び部分画像の符号データ)と、辞書符号化部650から入力された符号データ(画像辞書の符号データ)とを互いに対応付けてプリンタ装置10(図3)、記録装置24(図3)又は通信装置22(図3)に出力する。
次に、画像処理装置2による符号化処理の全体動作を説明する。
図7は、第1の実施形態における符号化プログラム5の動作(S10)を示すフローチャートである。
図7に示すように、S100において、画像入力部40(図4)は、プリンタ装置10(図3)から画像データ(2値)が入力されると、入力された画像データ(入力画像)を画像辞書作成部50に対して出力する。また、画像入力部40の文字認識部410(図4)は、入力画像に対して文字認識処理を行い、入力画像に含まれる文字画像の文字コード及び位置情報を1文字ずつ判定し、判定された文字コード及び位置情報を画像辞書作成部50に対して出力する。
文字画像抽出部510(図5)は、入力された位置情報に基づいて、入力画像から文字画像を1文字分ずつ切り出して記憶部500に出力する。
ステップ104(S104)において、登録制御部570は、入力画像から順に切り出される文字画像の文字コードに基づいて、画像辞書から画像パターン及びこの画像パターンのインデクスを読み出す。具体的には、記憶部500は、既に決定された画像パターン、この画像パターンに対して付与されたインデクス、及び、この画像パターンに対応する文字画像の文字コードを互いに対応付けて画像辞書として記憶している。登録制御部570は、文字画像抽出部510により新たに切り出された文字画像の文字コードを文字認識部410から取得し、取得された文字コードに対応する画像パターン及びインデクスを画像辞書から読み出す。
一致画素数Kは、画像における相対的な位置を示す位置ベクトルをx、画像パターンの黒画素の分布をS(x)、順に切り出される文字画像の番号をi(1〜N)、文字画像の黒画素の分布をP(i,x)、文字画像iのずらしベクトルをviとした場合に、以下の数式により算出される。
(一致画素数K)=Σ{S(x)*P(i,x−vi)}
なお、「Σ」は、変数xについての総和を示す。
次に、一致判定部530は、算出された一致画素数Kを正規化して、一致画素率K’を算出する。
一致画素率K’は、文字画像を構成する画素数をMとした場合に、以下の数式により算出される。
(一致画素率K’)=K/M
すなわち、登録制御部570は、一致度合いが基準以上である場合には、この文字画像に基づく画像パターンの登録を禁止して、この文字画像を既登録の画像パターンに基づいて符号化するよう符号化部60に指示し、一致度合いが基準よりも小さい場合には、この文字画像に対応するフォント画像を画像パターンとして画像辞書に新規登録するよう辞書決定部540に指示する。
(一致画素数K)=Σ{T(x)*P(i,x−vi)}
次に、一致判定部530は、この一致画素数Kに基づいて一致画素率K’を算出する。(一致画素率K’)=K/M
なお、付与されたインデクスは、符号化対象データとして順次符号化部60に出力される。
すなわち、画像辞書作成部50は、切り出された文字画像に対応する画像パターンが画像辞書に登録されていない場合に、画像辞書に登録するフォント画像を基準として、このフォント画像と文字画像とが最も一致するように切出し位置を補正する。
なお、補正ベクトルにより補正された文字画像の位置情報は、符号化対象データとして順次符号化部60に出力される。
すなわち、画像辞書作成部50は、切り出された文字画像に対応する画像パターンが既に画像辞書に登録されている場合に、登録されている画像パターンとこの文字画像とが最も一致するように切出し位置を補正する。
なお、補正ベクトルにより補正された文字画像の位置情報は、符号化対象データとして順次符号化部60に出力される。
すなわち、符号化部60は、切り出された文字画像と、この文字画像に対して提供されたフォント画像とがいずれも基準以上一致しない場合に、この切り出された文字画像そのものを符号化する。
ステップ132(S132)において、符号化部60は、符号化された画像辞書を入力画像の符号データに対応付けてプリンタ装置10又は記録装置24等に出力する。具体的には、符号出力部670は、辞書符号化部650により符号化された画像パターン及びインデクス(すなわち、画像辞書)を入力画像の符号データに対応付けて出力する。
また、本画像処理装置2は、文字認識処理の結果として取得した文字コードに基づいて、フォント画像を選択する。これにより、切り出された文字画像と比較すべきフォント画像が絞り込まれるため、画像辞書に登録するフォント画像の選択が容易になる。なお、画像処理装置2は、文字認識処理の結果としてフォントの種類又は文字画像の画像サイズ(例えばフォントサイズ)等が取得される場合に、フォントの種類又は画像サイズ等によりフォント画像を選択してもよいし、PDLデコンポーザ420で生成された文字識別情報によりフォント画像を選択してもよい。
また、本実施形態における画像処理装置2は、文字画像に最も近似するフォント画像を画像パターンとして画像辞書に登録する。これにより、原稿の汚れや複写の繰返しによる画質劣化などが解消されて可読性が向上する。
また、本実施形態における画像処理装置2は、フォント画像を基準として文字画像の切出し位置を補正する。これにより、復号化された画像において、文字画像それぞれの位置がより正確に再現される。特に、文字の切出し領域と切り出される文字とで重心位置が異なる場合などに好適である。
次に、第2の実施形態を説明する。
上記第1の実施形態では、画像辞書作成部50は、逐次的に入力画像から文字画像を切り出し、切り出された文字画像に基づいて順次画像辞書を作成していたが、本実施形態における第2の画像辞書作成部52は、1ページ又は1ドキュメントなどの入力画像全体に基づいて、画像辞書を作成する。
また、本実施形態における画像辞書作成部52は、形態が類似する複数のフォント画像に基づいて、画像辞書に登録すべき画像パターンを作成することにより、フォント画像の多様性に対応しつつ、高い符号化効率を実現する画像辞書を作成する。
図8(A)に例示するように、それぞれの文字コードには、形状が異なる複数のフォント画像が対応付けられている。例えば、数字の「1」に対応する文字コードに基づいて、形状が異なる複数のフォント画像が提供されうる。そして、上記第1の実施形態では、これらのフォント画像それぞれと一致する文字画像が入力画像中に存在すると、それぞれのフォント画像が画像パターンとして登録される。
しかしながら、これらフォント画像の違いは文字の可読性にそれほど影響を与えない。また、同一の文書内では同一のフォントが多く適用され、見出し等において他のフォントが稀に適用されるだけである。そして、出現頻度の低いフォント画像についても、画像辞書に画像パターンがそれぞれ登録されると、符号化効率の向上を妨げることとなる。
また、図8(B)に例示するように、文字認識処理のミスにより、形状が類似する文字(例えば、数字「1」とアルファベット大文字「I」と)が同一の文字コードとして判別されうる。この場合、少なくとも形状が近似しているため、可読性に与える影響はそれほど大きくないが、これらを区別できるように再現したい場合もある。
図9に示すように、第2の実施形態における画像辞書作成部52は、図5に示した第1の画像辞書作成部50において、登録制御部570を文字分類部580に置換した構成をとる。
文字分類部580は、文字コードに基づいて、入力画像から切り出された文字画像を複数の文字画像群に分類する。例えば、文字分類部520は、文字コードが一致する文字画像を同一の文字画像群に分類する。
この場合、辞書決定部540は、文字コードが一致する複数の文字画像に対応するフォント画像(複数の文字画像とそれぞれ最も一致するフォント画像)に基づいて、それぞれのフォント画像の出現頻度に応じた画像パターンを作成する。なお、文字分類部580が、切り出された文字画像それぞれに対応するフォント画像(それぞれの文字画像と最も一致するフォント画像)を、切り出された文字画像の文字コードに応じて分類してもよい。
図10に示すように、S100からS112の処理において、画像入力部40は、プリンタ装置10(図3)から画像データ(2値)が入力されると、入力された画像データ(入力画像)に対して文字認識処理を行い、文字認識処理の結果(文字コード及び位置情報)と入力画像とを画像辞書作成部50に対して出力する。
画像辞書作成部52は、入力された位置情報に基づいて、入力画像から文字画像を1文字分ずつ切り出し、切り出される文字画像の文字コードに基づいて、1つ以上のフォント画像をフォントDB525から読み出し、読み出されたフォント画像(1つ以上)と、切り出された文字画像とを相対的に移動させながら一致画素率K’を算出する。
ステップ204(S204)において、画像辞書作成部50は、入力画像に含まれる文字画像全てが切り出されたか否かを判定し、全ての文字画像が切り出された場合に、S206の処理に移行し、これ以外の場合に、S102の処理に戻り次の文字画像を切り出してS110からS204までの処理を繰り返す。
ステップ210(S210)において、辞書決定部540は、文字分類部580により分類されたフォント画像に基づいて、画像辞書に登録すべき画像パターンを作成する。
画像パターンの作成及びインデクスの付与が符号化対象として入力された全入力画像について終了すると、これらの画像パターン及びインデクスは、画像辞書として符号化部60に出力される。
符号化部60は、インデクス、位置情報、部分画像及び画像辞書の符号データを互いに対応付けてプリンタ装置10等に出力する。
図11に示すように、ステップ212(S212)において、一致判定部530は、文字コード毎に分類されたフォント画像を互いに比較して、複数の相対位置における一致度合いを判定する。具体的には、一致判定部530は、分類された複数のフォント画像(以下、フォント画像群)における黒画素の画素分布(ヒストグラム)を作成し、作成された画素分布と、このフォント画像群に含まれるフォント画像とを互いにずらしながら黒画素の一致画素数を算出する。なお、画素分布は、フォント画像群に属するフォント画像の黒画素を一致画素数が最大となる相対位置で領域毎に画素値を順次加算したヒストグラムである。
すなわち、フォント画像群の画素分布をQ(x)、各フォント画像の黒画素分布をP(i,x)、位置ベクトルをx、フォント画像群に属する各フォント画像をi(1〜N:Nはフォント画像群に属するフォント画像の数)、フォント画像iのずらしベクトルをviとした場合に、一致判定部530は、以下の数式により一致画素数を算出する。
(一致画素数K)=Σ{Q(x)*P(i,x−vi)}
なお、i=1の場合には、
Q(x)=P(1,x)
となり、
i>1の場合には、
Q(x)=P(1,x)+P(2,x−v2)+・・・+P(i−1,x−v(i−1))
となる。
Q’(x)=Q(x)/N
次に、一致判定部530は、以下の条件式により、分布確率Q’(x)が基準値よりも小さい部分を除去してQ”(x)を算出する。
Q’(x)>閾値Aの場合に、Q”(x)=1
上記以外の場合に、Q”(x)=0
すなわち、画像処理装置2は、出現回数の少ないフォント画像(すなわち、文字画像)については画像パターンの登録を行わず、文字画像そのものを符号化する。これにより、符号化効率の観点からみて不要な画像パターンの登録が排除される。
ステップ220(S220)において、辞書決定部540は、和結合パターンQ”(x)と、このフォント画像群に属するフォント画像との共通部分(積集合)を共通パターンとして抽出する。
ステップ222(S222)において、辞書決定部540は、抽出された共通パターンを画像パターンに決定する。なお、辞書決定部540は、それぞれのフォント画像に基づいて抽出された共通パターンすべてを画像辞書に登録するわけではなく、重複する共通パターンを排除して画像辞書に登録する。また、辞書決定部540は、それぞれの文字画像に基づいて抽出された複数の共通パターンのうち、黒画素の領域の違いが閾値以下である場合にも、重複するものとして排除してもよい。また、辞書決定部540は、和結合パターンQ”そのものを画像パターンとして画像辞書に登録してもよい。
位置補正部550は、一致判定部530により算出される一致画素数Kが最大となったときのずらしベクトルviを補正ベクトルとする。
図12に示すように、文字コードで分類されたフォント画像の黒画素の分布確率Q’(x)は、画素位置xによって異なる数値を示す。これは、フォント画像群の中に、形状の異なるフォント画像が異なる出現頻度で混在しているからである。分布確率Q’(x)は、閾値Bにより閾値処理がなされることにより、分布確率の低い部分を除去される。これにより、出現頻度が低いフォント文字(入力画像)の差分形状(出現頻度の高いフォント画像との差分)及びノイズ部分等を排除して、類型的な形状のみを画像パターンとすることができる。
辞書決定部540は、続いて、閾値B以上の部分を1とし、閾値Bよりも小さい部分を0とした和結合パターンQ”(x)を生成し、生成された和結合パターンQ”(x)と、フォント画像群に属する各フォント画像との共通部分を共通パターンとして抽出する。すなわち、辞書決定部540は、和結合パターンQ”(x)と、各フォント画像の画素分布P(i,x−vi)とを積演算する。これにより、フォント画像群の中に複数存在する類型的なフォント画像(出現頻度の高いフォント画像)の画像パターン#1及び画像パターン#2が抽出される。
図13に示すように、ステップ242(S242)において、パターン判定部610は、補正ベクトルによる補正後の位置情報に基づいて入力画像から切り出された部分画像(すなわち、文字画像)と、画像辞書に登録された画像パターンとを比較して、一致画素数を算出する。なお、パターン判定部610は、一致判定部530から一致画素数を取得してもよい。
ステップ244(S244)において、パターン判定部610は、一致する画像パターンが存在するか否かを判定する。具体的には、パターン判定部610は、それぞれの画像パターンについて算出された一致画素数が許容範囲(例えば、部分画像の全画素に対して90%以上)内であるか否かを判定し、許容範囲内である場合に、S246の処理に移行し、許容範囲外である場合に、S250の処理に移行する。
インデクス符号化部630は、パターン判定部610から入力されたインデクスを符号化し、インデクスの符号データを選択部660に対して出力する。
選択部660は、インデクス符号化部630から入力されたインデクスの符号データと、位置情報符号化部620から入力された位置情報の符号データとを互いに対応付けて符号出力部670に対して出力する。すなわち、選択部660は、部分画像毎に、インデクスと位置情報とを互いに対応付けられるように符号出力部670に出力する。
画像符号化部640は、パターン判定部610から入力された部分画像の画像データを符号化し、部分画像の符号データを選択部660に対して出力する。
選択部660は、画像符号化部640から入力された部分画像の符号データを符号出力部670に対して出力する。
ステップ254(S254)において、辞書符号化部650は、画像辞書作成部50から入力された画像辞書(画像パターンとインデクスとを互いに対応付けたもの)を符号化し、画像辞書の符号データを符号出力部670に対して出力する。
なお、本実施形態では、画像処理装置2は、文字コードに基づいて文字画像を文字画像群に分類したが、文字コード及び文字画像の大きさを用いて文字画像を分類してもよい。
次に、上記第2の実施形態の変形例を説明する。
図14は、同一の文字コードとして判定されうる複数の文字画像の共通形状及び差分形状を例示する図である。
図14(A)に例示するように、同一の文字コードに対して、形状が異なる(すなわち、フォントの種類が異なる)複数のフォント画像が対応付けられている。このように、文字コードに対応するフォント画像群は、大部分で同一の形状を有している。以下、フォント画像群に属する複数のフォント画像が共通して有する部分画像を共通形状といい、それぞれのフォント画像とこの共通形状との差分となる部分画像を差分形状という。
図14(B)に例示するように、これらのフォント画像を構成する部分形状のうち、第1レベルパターンは、これらのフォント画像の共通形状であるため出現頻度が特に高い。また、第2レベルパターンa及び第2レベルパターンbは、それぞれのフォント画像に固有の部分形状であり、第1レベルパターンに比べると出現頻度が低い。
そこで、本変形例における画像処理装置2は、文字コード毎に分類されたフォント画像群について、これらのフォント画像の共通形状及び差分形状をそれぞれ画像パターンとして画像辞書に階層的に登録する。
図15に示すように、S216において、辞書決定部540が、閾値処理後の画素分布について、分布数が0でない領域(黒画素の領域)が基準よりも広いか否かを判定し、基準以上である場合に、S312の処理に移行し、基準よりも狭い場合に、このフォント画像群について画像パターンの登録を行わずに、画像パターン作成処理(S310)を終了する。
ステップ312(S312)において、辞書決定部540は、分布確率Q’(x)において第1レベル閾値よりも大きな部分を共通形状の画像パターン(すなわち、第1レベルパターン)として抽出する。ここで、第1レベル閾値とは、フォント画像群に属するフォント画像が共通して有する共通形状と、他の形状とを分離するための基準であり、本例では、フォント画像群に属するほぼ全てのフォント画像で黒画素が存在する場合の分布確率(0.95など)である。
次に、辞書決定部540は、この分布確率Q1(x)において第2レベル閾値以上の部分を1、第2レベル閾値より小さい部分を0として、第1レベルパターンが除去された和結合パターンQ1”(x)を生成する。ここで、第2レベル閾値とは、共通形状の差分としてそれぞれのフォント画像を構成する差分形状であってフォント画像群において出現頻度が高いものを分離するための基準であり、第1レベル閾値よりも低く、例えば、目標となる符号量及び画質に応じて設定される。
そして、辞書決定部540は、この和結合パターンQ1”と、各フォント画像の画素分布P(i,x−vi)とを積演算して、これらの共通部分であるRi(x)を抽出し、抽出されたRi(x)を差分形状の画像パターン(すなわち、第2レベルパターン)に決定する。
図16に示すように、文字コードで分類されたフォント画像の黒画素の分布確率Q’(x)は、画素位置xによって異なる数値を示す。このうち、分布確率が最も高い部分は、このフォント画像群に属するフォント画像に共通する形状(すなわち、共通形状)であると考えられる。そして、分布確率が存在する他の領域は、それぞれのフォント画像と共通形状との差分に相当する形状(すなわち、差分形状)であると考えられる。
そこで、辞書決定部540は、共通形状(分布確率がほぼ最大となる領域)を抽出するための第1レベル閾値と、出現頻度の高い差分形状を抽出するための第2レベル閾値とを有している。
まず、辞書決定部540は、分布確率Q’(x)に対して第1レベル閾値により閾値処理を行い、第1レベルパターン(共通形状)に相当する部分を抽出する。次に、分布確率Q’(x)から、抽出された第1レベルパターンに相当する部分が除去されて、第2レベル閾値を基準として「1」又は「0」に変換されることにより、第2レベル和結合パターンQ1”(x)が生成される。
辞書決定部540は、この第2レベル和結合パターンQ1”(x)と、各フォント画像iの画素分布P(i,x)とを積演算することにより、これらの共通部分である第2レベルパターンを抽出する。本例では、第2レベル和結合パターンQ1”(x)と「フォント画像#1」との共通部分は、第2レベルパターンaとなり、第2レベル和結合パターンQ1”(x)と「フォント画像#2」との共通部分は、第2レベルパターンbとなる。
これにより、「フォント画像#1」は、第1レベルパターンと第2レベルパターンaとの和としてそれぞれのインデクスに置換でき、「フォント画像#2」は、第1レベルパターンと第2レベルパターンbとの和としてインデクスに置換できる。
図17に示すように、ステップ342(S342)において、パターン判定部610は、補正後の位置情報に基づいて入力画像から切り出された部分画像(すなわち、文字画像)と、画像辞書に登録された第1レベルパターンとを比較して、一致画素数を算出する。
ステップ344(S344)において、パターン判定部610は、入力された部分画像と一致する第1レベルパターンが存在するか否かを判定する。具体的には、パターン判定部610は、それぞれの第1レベルパターンについて算出された一致画素数が許容範囲(例えば、部分画像の全画素に対して90%以上)内であるか否かを判定し、許容範囲内である場合に、S346の処理に移行し、許容範囲外である場合に、S356の処理に移行する。
ステップ348(S348)において、パターン判定部610は、この第1レベルパターンの形状と、入力された部分画像との差分形状を抽出する。
ステップ350(S350)において、パターン判定部610は、この第1レベルパターンと対応付けられている第2レベルパターンを画像辞書から読み出し、読み出された第2レベルパターンと、抽出された差分形状とを比較して一致画素数を算出する。パターン判定部610は、それぞれの第2レベルパターンについて算出された一致画素数が許容範囲(例えば、差分形状の全画素に対して90%以上)内であるか否かを判定し、許容範囲内である場合に、S352の処理に移行し、許容範囲外である場合に、S354の処理に移行する。
なお、本例では、第1レベルパターン及び第2レベルパターンのいずれとも一致しない黒画素をノイズ等として除去しているが、これらの黒画素そのものを別途符号化してもよい。
選択部660は、インデクス符号化部630から入力されたインデクスの符号データと、位置情報符号化部620から入力された位置情報の符号データとを互いに対応付けて符号出力部670に対して出力する。すなわち、選択部660は、部分画像毎に、インデクスと位置情報とを互いに対応付けられるように符号出力部670に出力する。
画像符号化部640は、パターン判定部610から入力された部分画像の画像データを符号化し、部分画像の符号データを選択部660に対して出力する。
選択部660は、画像符号化部640から入力された部分画像の符号データを符号出力部670に対して出力する。
ステップ360(S360)において、辞書符号化部650は、画像辞書作成部50から入力された画像辞書(画像パターンとインデクスとを互いに対応付けたもの)を符号化し、画像辞書の符号データを符号出力部670に対して出力する。
また、画像処理装置2は、共通形状と差分形状とを階層化し、共通形状の符号データから順に出力することにより、復号化側で復号化した符号データの量に応じて徐々に画像品質を改善するプログレッシブ伝送を実現することができる。
これは、文字認識部410による文字認識の正確性(確度)は、入力画像に含まれる文字画像毎に異なる場合があり、文字認識結果(文字コード)に基づいて分類されたフォント画像群には、形状の類似しない文字画像が混在する可能性があるからである。すなわち、このように形状が類似しない文字画像が文字画像群に混在すると、画像辞書に登録される画像パターンが歪めらるなどの弊害が発生しうるため、本変形例における画像処理装置2は、文字認識処理の確度毎に画像辞書を作成して、文字認識処理におけるミスの影響を最小限にとどめる。
図18に例示するように、文字分類部520は、文字認識処理の確度を文字認識部410から取得し、取得された確度に応じて、切り出された文字画像に対応するフォント画像(文字画像と最も一致するフォント画像)を分類する。本例の文字分類部520は、「確度が90%以上」のフォント画像群、「確度が70%以上90%未満」のフォント画像群、及び、「確度が70%未満」のフォント画像群というように、確度の範囲によってフォント画像を分類している。
さらに、文字分類部520は、それぞれのフォント画像群を文字コードでさらに分類する。
このように、画像処理装置2は、文字認識処理の確度毎に画像辞書を作成することにより、文字認識処理のミスによる画像辞書への影響を最小限に抑えることができる。
5・・・符号化プログラム
40・・・画像入力部
410・・・文字認識部
420・・・PDLデコンポーザ
50,52・・・画像辞書作成部
500・・・記憶部
510・・・文字画像抽出部
520・・・フォント提供部
525・・・フォントデータベース
530・・・一致判定部
540・・・辞書決定部
550・・・位置補正部
560・・・インデクス付与部
570・・・登録制御部
580・・・文字分類部
60・・・符号化部
610・・・パターン判定部
620・・・位置情報符号化部
630・・・インデクス符号化部
640・・・画像符号化部
650・・・辞書符号化部
660・・・選択部
670・・・符号出力部
Claims (11)
- 文字コードに対応付けられた類型的な文字画像をテンプレート画像として複数提供するテンプレート提供手段と、
入力画像に含まれる文字画像と、前記テンプレート提供手段により提供される複数のテンプレート画像との一致度合いを判定する一致判定手段と、
前記一致判定手段により判定された一致度合いに基づいて、前記テンプレート提供手段により提供される複数のテンプレート画像から、入力画像に含まれる文字画像それぞれに対応するテンプレート画像を選択する選択手段と、
前記選択手段により選択されたテンプレート画像それぞれを、当該テンプレート画像に対応する文字画像の文字コードに基づいて分類する文字分類手段と、
前記文字分類手段により同一の文字コードに分類されたテンプレート画像それぞれの出現頻度に応じて、当該テンプレート画像の画素の分布を示す画素分布に対し、予め定められた閾値以下の分布数を除去する閾値処理を施した後、この入力画像において類型的な画像パターンを決定する類型決定手段と、
前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と
を有する画像辞書作成装置。 - 前記テンプレート提供手段は、前記テンプレート画像として、フォント画像を提供し、
前記一致判定手段は、提供されるフォント画像と、入力画像に含まれる文字画像とを比較して、一致度合いを判定する
請求項1に記載の画像辞書作成装置。 - 文字コードそれぞれに対応付けて、少なくとも1つのフォント画像を記憶するフォント記憶手段と、
入力画像に含まれる文字画像の文字コードを取得する情報取得手段と
をさらに有し、
前記テンプレート提供手段は、前記情報取得手段により取得された文字コードに対応するフォント画像を前記フォント記憶手段から読み出し、読み出されたフォント画像を前記テンプレート画像として提供し、
前記一致判定手段は、提供されるフォント画像と、入力画像に含まれる文字画像とを比較して、一致度合いを判定する
請求項2に記載の画像辞書作成装置。 - 前記一致判定手段は、前記テンプレート提供手段により文字コードに対応する複数のフォント画像が提供された場合に、提供された複数のフォント画像それぞれと、入力画像に含まれる文字画像とを比較して、それぞれのフォント画像について一致度合いを判定し、
前記類型決定手段は、それぞれのフォント画像について判定された一致度合いに基づいて、この文字画像と最も一致するフォント画像を画像パターンとして選択する
請求項3に記載の画像辞書作成装置。 - 入力画像における文字画像それぞれの領域を示す文字領域情報を取得する情報取得手段と、
前記情報取得手段により取得された文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段と
をさらに有し、
前記一致判定手段は、前記文字画像抽出手段により抽出された文字画像と、前記テンプレート提供手段により提供されたテンプレート画像とを比較して、一致度合いを判定する
請求項1又は2に記載の画像辞書作成装置。 - 前記一致判定手段は、前記文字画像抽出手段により抽出された文字画像と、前記テンプレート提供手段により提供されたテンプレート画像とを複数の相対位置で比較して、一致度合いを判定し、
前記一致判定手段によりそれぞれの相対位置で判定された一致度合いに基づいて、それぞれの文字画像の文字領域情報を補正する領域補正手段
をさらに有する請求項5に記載の画像辞書作成装置。 - 前記類型決定手段により順次決定される画像パターンを記憶するパターン記憶手段と、
前記パターン記憶手段により記憶された画像パターンと、新たに入力された文字画像と
を比較して、いずれかの画像パターンがこの文字画像と一致する場合に、この文字画像に対する画像パターンの決定を禁止する登録制御手段と
をさらに有し、
前記類型決定手段は、前記登録制御手段による指示に応じて、新たに入力された文字画像が前記パターン記憶手段に記憶された画像パターンと一致する場合に、この文字画像に対して提供されたテンプレート画像を前記パターン記憶手段に登録せず、入力された文字画像がいずれの画像パターンとも一致しない場合に、この文字画像に対して提供されたテンプレート画像を画像パターンとして前記パターン記憶手段に登録する
請求項1〜6のいずれかに記載の画像辞書作成装置。 - 文字コードに対応付けられた類型的な文字画像をテンプレート画像として複数提供するテンプレート提供手段と、
入力画像に含まれる文字画像と、前記テンプレート提供手段により提供される複数のテンプレート画像との一致度合いを判定する一致判定手段と、
前記一致判定手段により判定された一致度合いに基づいて、前記テンプレート提供手段により提供される複数のテンプレート画像から、入力画像に含まれる文字画像それぞれに対応するテンプレート画像を選択する選択手段と、
前記選択手段により選択されたテンプレート画像それぞれを、当該テンプレート画像に対応する文字画像の文字コードに基づいて分類する文字分類手段と、
前記文字分類手段により同一の文字コードに分類されたテンプレート画像それぞれの出現頻度に応じて、当該テンプレート画像の画素の分布を示す画素分布に対し、予め定められた閾値以下の分布数を除去する閾値処理を施した後、この入力画像において類型的な画像パターンを決定する類型決定手段と、
前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と、
入力画像に含まれている文字画像のデータを、この文字画像の入力画像における量言いを示す文字領域情報、及び、この文字画像に対応する画像パターンの識別情報と置換して符号化する符号化手段と
を有する符号化装置。 - 前記一致判定手段は、入力画像に含まれる文字画像と、前記テンプレート提供手段により提供されたテンプレート画像とを複数の相対位置で比較して、一致度合いを判定し、
入力画像における文字画像それぞれの領域を示す文字領域情報を取得する情報取得手段と、
前記一致判定手段によりそれぞれの相対位置で判定された一致度合いに基づいて、前記情報取得手段により取得された文字領域情報を補正する領域補正手段と
をさらに有し、
前記符号化手段は、前記領域補正手段により補正された文字画像の文字領域情報と、この文字画像に対応する画像パターンの識別情報とを互いに対応付けて符号化する
請求項8に記載の符号化装置。 - コンピュータを含む画像辞書作成装置において、コンピュータが、
文字コードに対応付けられた類型的な文字画像をテンプレート画像として複数提供し、
入力画像に含まれる文字画像と、提供される複数のテンプレート画像との一致度合いを判定し、
判定された一致度合いに基づいて、提供される複数のテンプレート画像から、入力画像に含まれる文字画像それぞれに対応するテンプレート画像を選択し、
選択されたテンプレート画像それぞれを、当該テンプレート画像に対応する文字画像の文字コードに基づいて分類し、
同一の文字コードに分類されたテンプレート画像それぞれの出現頻度に応じて、当該テンプレート画像の画素の分布を示す画素分布に対し、予め定められた閾値以下の分布数を除去する閾値処理を施した後、この入力画像において類型的な画像パターンを決定し、
決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する
画像辞書作成方法。 - コンピュータを含む画像辞書作成装置において、
文字コードに対応付けられた類型的な文字画像をテンプレート画像として複数提供するステップと、
入力画像に含まれる文字画像と、提供される複数のテンプレート画像との一致度合いを判定するステップと、
判定された一致度合いに基づいて、提供される複数のテンプレート画像から、入力画像に含まれる文字画像それぞれに対応するテンプレート画像を選択するステップと、
選択されたテンプレート画像それぞれを、当該テンプレート画像に対応する文字画像の文字コードに基づいて分類するステップと、
同一の文字コードに分類されたテンプレート画像それぞれの出現頻度に応じて、当該テンプレート画像の画素の分布を示す画素分布に対し、予め定められた閾値以下の分布数を除去する閾値処理を施した後、この入力画像において類型的な画像パターンを決定するステップと、
決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与するステップと
を前記画像辞書作成装置のコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004116646A JP4645058B2 (ja) | 2004-04-12 | 2004-04-12 | 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004116646A JP4645058B2 (ja) | 2004-04-12 | 2004-04-12 | 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005301662A JP2005301662A (ja) | 2005-10-27 |
JP4645058B2 true JP4645058B2 (ja) | 2011-03-09 |
Family
ID=35333116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004116646A Expired - Fee Related JP4645058B2 (ja) | 2004-04-12 | 2004-04-12 | 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4645058B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101938878B1 (ko) * | 2018-06-14 | 2019-01-15 | 김보언 | 블록체인 기반 저작권 관리 시스템 |
KR101983530B1 (ko) * | 2019-01-08 | 2019-05-29 | 김보언 | 블록체인에 저작물을 저장하는 등록 시스템 |
KR101983529B1 (ko) * | 2019-01-08 | 2019-05-29 | 김보언 | 저작권 침해 방지를 위한 스마트 컨트랙트 시스템 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5605009B2 (ja) * | 2010-06-21 | 2014-10-15 | 富士通株式会社 | 文字画像圧縮装置及び文字画像復元装置、文字画像圧縮方法及び文字画像復元方法、並びに文字画像圧縮プログラム及び文字画像復元プログラム |
JP6269256B2 (ja) * | 2014-03-31 | 2018-01-31 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置、画像形成装置、情報処理方法、及び情報処理プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000067164A (ja) * | 1998-08-26 | 2000-03-03 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体 |
JP2001236467A (ja) * | 2000-02-21 | 2001-08-31 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体 |
JP2003050971A (ja) * | 2001-08-07 | 2003-02-21 | Riso Kagaku Corp | フォント選択プログラム、画像処理装置及び画像形成装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06105398B2 (ja) * | 1986-03-31 | 1994-12-21 | 株式会社東芝 | パタ−ン認識学習装置 |
JPS6382061A (ja) * | 1986-09-26 | 1988-04-12 | Ricoh Co Ltd | デ−タ圧縮方式 |
JPH07262317A (ja) * | 1994-03-18 | 1995-10-13 | Ricoh Co Ltd | 文書処理装置 |
JPH08101893A (ja) * | 1994-09-30 | 1996-04-16 | Omron Corp | 画像処理装置におけるモデル画像データ登録装置 |
JPH08255223A (ja) * | 1995-03-16 | 1996-10-01 | Fuji Electric Co Ltd | 文字認識装置における類似文字判別方法 |
JPH10178638A (ja) * | 1996-12-18 | 1998-06-30 | Nippon Telegr & Teleph Corp <Ntt> | 文字領域符号化方法、復号方法、文字領域符号化装置および復号装置 |
-
2004
- 2004-04-12 JP JP2004116646A patent/JP4645058B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000067164A (ja) * | 1998-08-26 | 2000-03-03 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体 |
JP2001236467A (ja) * | 2000-02-21 | 2001-08-31 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体 |
JP2003050971A (ja) * | 2001-08-07 | 2003-02-21 | Riso Kagaku Corp | フォント選択プログラム、画像処理装置及び画像形成装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101938878B1 (ko) * | 2018-06-14 | 2019-01-15 | 김보언 | 블록체인 기반 저작권 관리 시스템 |
WO2019240406A1 (ko) * | 2018-06-14 | 2019-12-19 | 김보언 | 블록체인 기반 저작권 관리 시스템 |
KR101983530B1 (ko) * | 2019-01-08 | 2019-05-29 | 김보언 | 블록체인에 저작물을 저장하는 등록 시스템 |
KR101983529B1 (ko) * | 2019-01-08 | 2019-05-29 | 김보언 | 저작권 침해 방지를 위한 스마트 컨트랙트 시스템 |
Also Published As
Publication number | Publication date |
---|---|
JP2005301662A (ja) | 2005-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7889926B2 (en) | Image dictionary creating apparatus, coding apparatus, image dictionary creating method | |
KR100938099B1 (ko) | 클러스터링 시스템, 클러스터링 방법, 문서 인코딩 시스템 및 클러스터링 방법을 수행하기 위한 컴퓨터 판독가능 매체 | |
US8411955B2 (en) | Image processing apparatus, image processing method and computer-readable medium | |
US8755604B1 (en) | Using shape similarity methods to improve OCR speed and accuracy | |
CN101419673B (zh) | 图像词典生成装置及方法 | |
US20040213458A1 (en) | Image processing method and system | |
EP0933719B1 (en) | Image processing method and apparatus | |
JP2001203897A (ja) | パタンマッチング符号化装置及び方法 | |
US20060182358A1 (en) | Coding apparatus, decoding apparatus, data file, coding method, decoding method, and programs thereof | |
JP4645058B2 (ja) | 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム | |
JP4977232B2 (ja) | 文字読取結果確認装置および文字読取結果確認方法 | |
JP2011013900A (ja) | 画像処理装置、画像処理方法、プログラム、及び記憶媒体 | |
US20050281463A1 (en) | Method and apparatus for processing binary image | |
JPH11272798A (ja) | ボ―ルド体文字を区別する方法及び装置 | |
JP2005352735A (ja) | 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム | |
CN112204562A (zh) | 音乐字符系统 | |
Robertson | Optical character recognition for classical philology | |
US6961465B2 (en) | System and method for efficient determination of recognition initial conditions | |
JP2005323169A (ja) | 画像処理装置、データファイル、画像処理方法及びそのプログラム | |
US20030152270A1 (en) | Image encoding device, decoding device and encoding method, decoding method, and recorded program on which programs of the methods are recorded | |
JP2005352734A (ja) | 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム | |
JP4465654B2 (ja) | 画像辞書作成装置、符号化装置、符号化方法及びそのプログラム | |
JPH07160824A (ja) | 文字認識装置 | |
JP5457853B2 (ja) | 画像符号化装置、画像符号化方法、プログラム及び記憶媒体 | |
JP2006277150A (ja) | 画像分離装置、画像分離方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070322 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100330 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100527 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101109 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101122 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4645058 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |