JP3731800B2 - Document data creation method and apparatus, and character data restoration method and apparatus - Google Patents
Document data creation method and apparatus, and character data restoration method and apparatus Download PDFInfo
- Publication number
- JP3731800B2 JP3731800B2 JP2000084848A JP2000084848A JP3731800B2 JP 3731800 B2 JP3731800 B2 JP 3731800B2 JP 2000084848 A JP2000084848 A JP 2000084848A JP 2000084848 A JP2000084848 A JP 2000084848A JP 3731800 B2 JP3731800 B2 JP 3731800B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- character
- document
- information code
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Editing Of Facsimile Originals (AREA)
- Processing Or Creating Images (AREA)
- Document Processing Apparatus (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、パーソナルコンピュータやワードプロセッサなどで作成された文書のビットマップデータを作成する方法および装置、並びにビットマップから文字データを復元する方法および装置に関するものである。
【0002】
【従来の技術】
従来、ユーザがパーソナルコンピュータ(以下パソコンという)やワードプロセッサ(以下ワープロという)で任意に作成した文書のデジタルデータ(各文字の文字コードおよび印字位置の情報)を保管しておいたり、持ち運んだりすることができる記録媒体(記憶媒体)として、フロッピーディスクやCD−ROMなどが広く知られている。この種の記録媒体に記録されている文書の内容は、記録媒体に対応する装置、例えばFDドライブ装置やCD−ROMドライブ装置などの読出装置を搭載したパソコンやワープロを用いることで誤りなく復元させることができる。
【0003】
ただし、保管状態にある多数の記録媒体の中から、所望の文書を記録した媒体を見つけ出す(いわゆる検索)ためには、パソコンやワープロを用いて、記録されている文書をファイル名を頼りに順次読み出して画面に表示して内容を確認する必要がある。しかしながら、このような方法は、作業効率が悪いという問題点がある。
【0004】
一方、持ち運び(ハンドリング)中の時間を利用して文書の内容を確認するためには、記録媒体とともに表示部を有する携帯型の読出装置を持ち歩くか、または該文書の印刷物(紙媒体)を持ち歩く必要がある。しかしながら、読出装置を持ち歩く方法では、見難くない程度の表示画面を備えた装置にすると持ち運ぶのに大きすぎたり重すぎたりするという問題があり、印刷物を持ち歩く方法では、記録媒体と印刷物との両方を管理(ファイル)する必要があり、二重管理が生じるという問題点がある。
【0005】
そこで、上述のような問題点を解決する一方法として、文書を印刷物でのみハンドリングすることとし、公知の種々の文字認識方法を用いて、印刷物の文字を認識することで、文書のデジタルデータを復元するということが考えられる。
【0006】
この際、例えば特開昭62−243087号などに提案されているように、文字コードや文字位置(以下文字情報という)だけでなく、アンダーライン、倍角、フォント、サイズ、あるいはスタイルなどの文字の属性を示す情報(以下属性情報という)とともに復元するということも考えられる。
【0007】
ここで、上記特開昭62−243087号に提案されている方法とは、用紙上において、文書内容を示す文字に加えて、例えば、倍角文字を指定する場合はマル囲み付きBS、アンダーラインを指定する場合はマル囲み付きUSなど前記属性情報を示す属性指定文字を属性が変化する文字の直前に記入しておき、文字認識の際に、前記属性指定文字を認識したときには、この属性指定文字の情報に基づいてアンダーラインを付したり倍角文字にするなど文書内容を示す文字を修飾するというものである。
【0008】
この方法を用いれば、パソコンなどで作成した文書を紙出力のみで管理することができるようになるので、文書内容の確認や検索が容易にでき、また文書のデジタルデータを文書内容だけでなく属性情報も含めて復元でき、さらに、二重管理という問題を生じることがない文書管理方法にすることができる。
【0009】
【発明が解決しようとする課題】
しかしながら、上記特開昭62−243087号に提案されている方法では、属性が変化する文字の直前に属性指定文字を記入するので、元データの文字レイアウト(文字が配される位置)と印刷物上の文字レイアウトとが一致しなくなるという問題がある。このため、印刷物上の文字を見ただけでは、元データや復元される文書のレイアウトの間違いやバランスの悪さに気付くことができないという問題を招くことにもなる。
【0010】
本発明は上記事情に鑑みてなされたものであり、文書内容の確認や検索が容易にでき、また文書のデジタルデータを文書内容だけでなく属性情報も含めて復元でき、さらに、二重管理という問題を生じることがない文書管理方法を実現するに際して、文書の印刷物を見ただけで、元データや該印刷物から復元される文書内容およびレイアウトを確認することができる文字認識用文書のビットマップデータを作成する方法および装置、並びにビットマップから文字データを復元する方法および装置を提供することを目的とするものである。
【0011】
【課題を解決するための手段】
本発明による第1の文書データ作成方法は、コンピュータにより作成された文書原稿データに基づいて文書のビットマップデータを作成する文書データ作成方法であって、前記文書原稿データを構成する各文字の情報から文字情報と属性情報を抽出し、該抽出した各文字の文字情報に応じて、基礎フォント文字に変形を加えたキャリアフォント文字のビットマップを使用して前記文書原稿データに対応するビットマップデータを作成し、前記抽出した各文字の属性情報を、該属性情報と該属性情報を表わす情報コードとの対応を表す第1の変換テーブルに基づいて前記情報コードに変換し、前記作成されたビットマップデータの各画素のうち所定の条件に合致した画素を、前記情報コードを合成することができる合成可能画素として抽出し、前記情報コードを前記合成可能画素に順次付加するものである。
【0012】
本発明による第2の文書データ作成方法は、第1の文書データ作成方法と同様に作成された文書のビットマップデータに情報コードを付加(合成)するに際して、情報コードを圧縮した後に付加するようにしたものであって、文書原稿データを構成する各文字の情報から文字情報と属性情報を抽出し、該抽出した各文字の文字情報に応じて、基礎フォント文字に変形を加えたキャリアフォント文字のビットマップを使用して前記文書原稿データに対応するビットマップデータを作成し、前記抽出した各文字の属性情報を、該属性情報と該属性情報を表わす情報コードとの対応を表す第1の変換テーブルに基づいて前記情報コードに変換し、前記情報コードが、文字によって固有な固有情報と行単位または段落単位で同一である非固有情報とに分離されるものであり、前記文書原稿データを構成する文字のうち連なった文字の前記非固有情報を消去して、前記連なった文字の情報コードを圧縮して圧縮済情報コードを生成し、前記作成されたビットマップデータの各画素のうち所定の条件に合致した画素を、前記圧縮済情報コードを合成することができる合成可能画素として抽出し、前記圧縮済情報コードを前記合成可能画素に順次付加するものである。
【0013】
ここで「圧縮」は、文書の全文字についての全情報コードの量が少なくなるように、所定の文字についての情報コードのみを圧縮するものであってもよい。
【0014】
また、「キャリアフォント文字」は、該キャリアフォント文字のビットマップに情報コードを付加したときに、後述する文字データ復元過程において、情報コードを付加したものであるのか否かを認識するのに都合がよい文字であって、文字データ復元過程において情報コードを付加したものであるのか否かを認識することができる限り、どのようなものを使用してもよく、また、従来から使用されている文字を変形して得たものであってもよい。
【0015】
また「圧縮済情報コードを合成することができる合成可能画素」は、後述する文字データ復元過程において、情報コードを付加した画素であるのか否かを認識するのに都合がよい画素であって、文字データ復元過程において情報コードを付加したものであるのか否かを認識することができる限り、いずれの画素を合成可能画素としてもよい。なお、情報コードを付加することによって、元の文字の認識性を落とさないように配慮するのが望ましい。
あるいは、前記キャリアフォント文字は、走査方向のライン上に並ぶ黒画素群のランレングスが奇数値になるように変形したものであり、前記合成可能画素が、前記走査方向のライン上に並ぶ黒画素群に隣接する白画素であり、かつ、該白画素を黒画素に変えても2つの黒画素群がつながらない白画素であってもよい。
【0016】
一方、本発明による第1の文字データ復元方法は、上記第1の文書データ作成方法を使用して作成された文書のビットマップデータから文書の文字データを復元する方法であって、文書のビットマップ中の前記合成可能画素に付加された前記情報コードを抽出し、前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記抽出した情報コードを属性情報に変換し、該抽出した情報コードを前記文書のビットマップから除去し、該情報コードが除去されたビットマップに基づいて文字情報を復元することを特徴とするものである。
さらに、キャリアフォント文字が、走査方向のライン上に並ぶ黒画素群のランレングスが奇数値になるように変形したものである場合には、上記第1の文書データ作成方法を使用して作成された文書のビットマップから走査方向のライン上に並ぶ黒画素群のランレングスが偶数値であるか奇数値であるかに基づいて前記情報コードを抽出し、前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記抽出した情報コードを属性情報に変換し、該抽出した情報コードを前記文書のビットマップから除去し、該情報コードが除去されたビットマップに基づいて文字情報を復元するものであってもよい。
【0017】
また、本発明による第2の文字データ復元方法は、上記第2の文書データ作成方法を使用して作成された文書のビットマップから文書の文字データを復元する方法であって、文書のビットマップ中の前記合成可能画素に付加された前記圧縮済情報コードを抽出し、該抽出した圧縮済情報コードを復元して圧縮前の前記情報コードを求め、前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記求めた情報コードを属性情報に変換し、前記抽出した圧縮済情報コードを前記文書のビットマップから除去し、該圧縮済情報コードが除去されたビットマップに基づいて文字情報を復元することを特徴とするものである。
さらに、キャリアフォント文字が、走査方向のライン上に並ぶ黒画素群のランレングスが奇数値になるように変形したものである場合には、上記第2の文書データ作成方法を使用して作成された文書のビットマップから走査方向のライン上に並ぶ黒画素群のランレングスが偶数値であるか奇数値であるかに基づいて前記圧縮済情報コードを抽出し、該抽出した圧縮済情報コードを復元して圧縮前の前記情報コードを求め、前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記求めた情報コードを属性情報に変換し、前記抽出した圧縮済情報コードを前記文書のビットマップから除去し、該圧縮済情報コードが除去されたビットマップに基づいて文字情報を復元するものであってもよい。
【0018】
上記第1および第2の文字データ復元方法においては、復元した文字情報に対して、変換された属性情報に基づいて修飾を施すことが望ましい。
【0019】
本発明による第1の文書データ作成装置は、上記第1の文書データ作成方法を実施する装置、すなわち、コンピュータにより作成された文書原稿データに基づいて文書のビットマップデータを作成する文書データ作成装置であって、基礎フォント文字に変形を加えたキャリアフォント文字のビットマップデータを記憶するキャリアフォント文字記憶手段と、前記文書原稿データを構成する各文字の情報から文字情報と属性情報を抽出する文字・属性情報抽出手段と、該抽出した各文字の文字情報に応じて、前記キャリアフォント文字記憶手段からキャリアフォント文字のビットマップを読み出して前記文書原稿データに対応するビットマップデータを作成するビットマップデータ作成手段と、前記抽出した各文字の属性情報を、該属性情報と該属性情報を表わす情報コードとの対応を表す第1の変換テーブルに基づいて前記情報コードに変換する属性情報変換手段と、前記作成されたビットマップデータの各画素のうち所定の条件に合致した画素を、前記情報コードを合成することができる合成可能画素として抽出する情報合成可能画素抽出手段と、前記情報コードを前記合成可能画素に順次付加する情報コード合成手段とを備えたことを特徴とするものである。
【0020】
本発明による第2の文書データ作成装置は、上記第2の文書データ作成方法を実施する装置、すなわち、コンピュータにより作成された文書原稿データに基づいて文書のビットマップデータを作成する文書データ作成装置であって、基礎フォント文字に変形を加えたキャリアフォント文字のビットマップデータを記憶するキャリアフォント文字記憶手段と、前記文書原稿データを構成する各文字の情報から文字情報と属性情報を抽出する文字・属性情報抽出手段と、該抽出した各文字の文字情報に応じて、前記キャリアフォント文字記憶手段からキャリアフォント文字のビットマップを読み出して前記文書原稿データに対応するビットマップデータを作成するビットマップデータ作成手段と、前記抽出した各文字の属性情報を、該属性情報と該属性情報を表わす情報コードとの対応を表す第1の変換テーブルに基づいて前記情報コードに変換する属性情報変換手段と、前記情報コードが、文字によって固有な固有情報と行単位または段落単位で同一である非固有情報とに分離されるものであり、前記文書原稿データを構成する文字のうち連なった文字の前記非固有情報を消去して、前記連なった文字の情報コードを圧縮して圧縮済情報コードを生成する情報コード圧縮手段と、前記作成されたビットマップデータの各画素のうち所定の条件に合致した画素を、前記圧縮済情報コードを合成することができる合成可能画素として抽出する情報合成可能画素抽出手段と、前記圧縮済情報コードを前記合成可能画素に順次付加する情報コード合成手段とを備えたことを特徴とするものである。
【0021】
また、本発明による第1の文字データ復元装置は、上記第1の文字データ復元方法を実施する装置、すなわち、上記第1の文書データ作成装置により作成された文書のビットマップから文書の文字データを復元する文字データ復元装置であって、文書のビットマップ中の前記合成可能画素に付加された前記情報コードを抽出する情報コード抽出手段と、前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記抽出した情報コードを属性情報に変換する情報コード変換手段と、前記抽出した情報コードを前記文書のビットマップから除去する情報コード除去手段と、該情報コードが除去されたビットマップに基づいて文字情報を復元する文字認識手段とを備えたことを特徴とするものである。
さらに、キャリアフォント文字が、走査方向のライン上に並ぶ黒画素群のランレングスが奇数値になるように変形したものである場合には、上記第1の文書データ作成装置により作成された文書のビットマップから走査方向のライン上に並ぶ黒画素群のランレングスが偶数値であるか奇数値であるかに基づいて前記情報コードを抽出する情報コード抽出手段と、前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記抽出した情報コードを属性情報に変換する情報コード変換手段と、前記抽出した情報コードを前記文書のビットマップから除去する情報コード除去手段と、該情報コードが除去されたビットマップに基づいて文字情報を復元する文字認識手段とを備えたものであってもよい。
【0022】
本発明による第2の文字データ復元装置は、上記第2の文字データ復元方法を実施する装置、すなわち、上記第2の文書データ作成装置により作成された文書のビットマップから文書の文字データを復元する文字データ復元装置であって、文書のビットマップ中の前記合成可能画素に付加された前記圧縮済情報コードを抽出する情報コード抽出手段と、該抽出した圧縮済情報コードを復元して圧縮前の前記情報コードを求める情報コード復元手段と、前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記復元した情報コードを前記属性情報に変換する情報コード変換手段と、前記抽出した圧縮済情報コードを前記文書のビットマップから除去する情報コード除去手段と、該圧縮済情報コードが除去されたビットマップに基づいて文字情報を復元する文字認識手段とを備えたことを特徴とするものである。
さらに、キャリアフォント文字が、走査方向のライン上に並ぶ黒画素群のランレングスが奇数値になるように変形したものである場合には、上記第2の文書データ作成装置により作成された文書のビットマップから走査方向のライン上に並ぶ黒画素群のランレングスが偶数値であるか奇数値であるかに基づいて前記圧縮済情報コードを抽出する情報コード抽出手段と、該抽出した圧縮済情報コードを復元して圧縮前の前記情報コードを求める情報コード復元手段と、前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記復元した情報コードを前記属性情報に変換する情報コード変換手段と、前記抽出した圧縮済情報コードを前記文書のビットマップから除去する情報コード除去手段と、該圧縮済情報コードが除去されたビットマップに基づいて文字情報を復元する文字認識手段とを備えたものであってもよい。
【0023】
本発明による第1および第2の文字データ復元装置においては、復元した文字情報に対して、変換された属性情報に基づいて修飾を施す修飾手段を更に備えたものとするのが望ましい。
【0024】
【発明の効果】
本発明による第1の文書データ作成方法および装置、並びに第1の文字データ復元方法および装置(以下纏めて第1の発明という)によれば、文書データ作成過程において、文書原稿を構成する各文字の情報から文字情報と属性情報を抽出し、抽出した文字情報に応じて作成された文書原稿に対応するビットマップデータに抽出した属性情報を表す情報コードを付加し、文字データ復元過程において、文書のビットマップから各文字の情報コードを抽出して、変換テーブルを参照して情報コードを属性情報に変換する一方、情報コードを除去した後のビットマップに基づいて文字認識を行なって文字情報を復元するようにしたので、元の文書のデジタルデータを属性情報も含めて正確に復元させることができる。
【0025】
このように、第1の発明によれば、文書のデジタルデータを文書内容だけでなく属性情報も含めて復元することができるようにしているので、結果として、パソコンなどで作成した文書を紙出力のみで管理することができるようになるので、二重管理という問題を生じることがない文書管理方法にすることができる。
【0026】
また、第1の文書データ作成方法および装置における文書データ作成過程においては、文字の属性情報を属性指定文字の記入ではなく、キャリアフォント文字のビットマップに情報コードとして付加しているので、元データのレイアウトを崩すことなく属性情報を付加することができ、パソコンなどで作成した文書の元データと略同じ位置に各文字が出力され、元データの文字レイアウトと印刷物上の文字レイアウトとが一致しなくなるという問題が生じることがなく、文書の印刷物を見ただけで、元データや該印刷物から復元される文書内容およびレイアウトを確認することができる。
【0027】
また、本発明による第2の文書データ作成方法および装置、並びに第2の文字データ復元方法および装置(以下纏めて第2の発明という)によれば、文書データ作成過程において、情報コードを圧縮した後に第1の発明と同様の方法により圧縮済情報コードを付加し、文字データ復元過程において、文書のビットマップから抽出した圧縮済情報コードを元の情報コードに復元して、第1の発明と同様の方法により、属性情報や文字情報を得るようにしたので、同一の情報量を復元するための情報コード数を、情報コードを圧縮しない場合に比べて縮小でき、復元できる属性情報量が第1の発明よりも増加するという効果がある。
【0028】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態について詳細に説明する。
【0029】
図1は後述する本発明の実施の形態による文書データ作成方法および文字データ復元方法を実施する各装置に使用されるキャリアフォント文字のビットマップを作成する装置の構成を示すブロック図である。
【0030】
図1に示すように、このビットマップフォント作成装置1は、基礎ビットマップフォントを構成する基礎フォント文字のビットマップデータを記憶する基礎フォント文字記憶手段10と、読み出したビットマップデータが表す基礎フォント文字のビットマップに対して、後述する方法を用いて変形を加えることにより、水平方向1ラインごとの黒画素群の構成画素数(以下ランレングスという)を奇数値にすることにより、新たなフォント文字(以下キャリアフォント文字という)を作成するキャリアフォント文字作成手段11とを備えている。
【0031】
このランレングスが奇数値にされたキャリアフォント文字は、従来のフォント文字自体の各ランレングスが全て奇数値である場合もあるが、そうでないときには、従来のフォント文字を基礎フォント文字としてビットマップ化した後に、後述する方法を用いて微小変形を加えることで作成することができる。ここで、ランレングスを奇数化しているのは、文字の属性情報を二値データとして文字のビットマップに付加(合成)し、付加した二値データを復元(分離)できるようにするためである(詳細は後述する)。
【0032】
次に、ビットマップフォント作成装置1によるビットマップフォントの作成方法、つまりビットマップフォントを構成する多数のキャリアフォント文字を作成する方法について、図2に示すフローチャートを参照して説明する。なお、図2中、ステップ番号にはS印を付す。
【0033】
1)キャリアフォント文字作成手段11は、先ず、基礎フォント文字記憶手段10に格納されている、キャリアフォント文字の基礎となる特定のフォント文字(基礎フォント文字)、サイズ、およびスタイルを有する一般的な文字である基礎フォント文字のセット(フォントデータ)から、任意の1文字のデータを選択して読み出す。そして、読み出した基礎フォント文字の文字サイズに応じて固有な領域内で水平方向1ラインごとに走査を行ない(ステップ1)、黒画素を検出する(ステップ2)。さらに、検出された黒画素を先頭とする黒画素群のランレングスを計数する(ステップ3)。
【0034】
ここで、固有な領域としては、図6の文字の周囲に点線を付した矩形領域とするとよい。また、走査とは、画像データ上でのことを意味し、例えば基礎フォント文字の画素データをエリアメモリにそのビットマップに対応させて格納し、このメモリ上において走査するとよい。
【0035】
ステップ3において計数された黒画素群のランレングスが、奇数であるか否かを判定し(ステップ4)、奇数でないと判定された場合には、黒画素群を構成する走査方向最前段の画素を白画素に変換して、ランレングスを奇数化する(ステップ5)。
【0036】
2)ステップ4においてランレングスが奇数であると判定された場合およびステップ5においてランレングスを奇数化した後には、ステップ1からステップ4あるいはステップ5までの処理を、上記文字サイズに応じて固有な領域内の全ラインの走査が終了するまで繰り返し行なう。
【0037】
そして、以上の処理を、全ての基礎フォント文字に対して行なうことで、キャリアフォント文字のフォントデータが作成される。作成されたフォントデータは、例えばCD−ROMなどのコンピュータ読取り可能な媒体に記録して配布するとよい。図3(a)に漢字「旅」および「行」についての各キャリアフォント文字のビットマップデータの一例を示す。
【0038】
このように、上記方法を用いれば、簡単な方法でキャリアフォント文字のビットマップデータを作成することができる。
【0039】
次に、上述のようにして作成されたキャリアフォント文字からなるビットマップフォントを用いて文書のビットマップデータを作成する、本発明に係る文書データ作成部を備えた文書作成装置、および文書作成装置により作成、出力された印刷物から文書の文字データを復元する、本発明に係る文書データ復元部を備えた文書復元装置の第1の実施の形態について説明する。なお、この文書作成装置と文書復元装置とを合わせて、紙によるデジタル・インターフェース・システム(以下紙DIFシステムという)という。
【0040】
図4は文書作成装置の概略構成を示すブロック図、図5は文書復元装置の概略構成を示すブロック図、図6はパソコンやワープロなどで作成された文書原稿の一例を示す図である。
【0041】
文書作成装置2は、図4に示すように、文字・属性情報抽出手段20と、キャリアフォント文字記憶手段31、文書ビットマップデータ作成手段32、情報合成可能画素抽出手段33、本発明の第1の変換テーブルとしての属性情報変換テーブル34、属性情報変換手段35、および情報コード合成手段36からなる文書データ作成部30と、プリンタなどの画像出力手段40とから構成されており、ユーザがパソコンやワープロで任意に作成した文書の文字および属性情報に応じて、キャリアフォント文字を用いた文字認識用文書としての情報コード合成文書の印刷物50を作成し、出力するものである。
【0042】
文書データ作成部30を構成するキャリアフォント文字記憶手段31には、上述したビットマップフォント作成装置1により作成されたキャリアフォント文字を格納するものである。なお、フォントデータの入手に際しては、例えば専用フォント文字のセットを記録したCD−ROMなどの媒体を不図示の読取装置で読み取って、読み取ったデータをキャリアフォント文字記憶手段31に記憶させるとよい。
【0043】
文書データ作成部30を構成する文書ビットマップデータ作成手段32は、ユーザがパソコンやワープロで任意に作成した文書の各文字の文字情報のうちの文字コードに応じてキャリアフォント文字記憶手段31に記憶されている所定のキャリアフォント文字のビットマップデータを読み出し、この読み出したキャリアフォント文字のビットマップデータを、各文字の文字情報のうち文字位置基準点の座標に応じて、元の文書の大きさに対応する全画素が白のデジタル画像の所定の位置に貼り付けることによって、キャリアフォント文字を用いた文書のビットマップデータを作成するものである。
【0044】
ここで、文字位置基準点の座標としては、文字サイズに応じて固有な領域内の所定の座標とすればよく、本例においては、図6中●で示す、各文字の周囲に点線を付した矩形領域a内の左上頂点画素の座標とする。なお、これに限らず、文字の基準位置を定めることができるかぎり、その他の座標を文字位置基準点の座標としてもよい。
【0045】
文書データ作成部30を構成する情報合成可能画素抽出手段33は、キャリアフォント文字を用いた文書の画像領域内での水平方向1ラインごとの走査によって、情報合成可能画素としての黒画素群を構成する走査方向最前段の画素に隣接する白画素を抽出するものである。
【0046】
文書データ作成部30を構成する属性情報変換手段35は、フォント、サイズ、スタイルおよび文字位置基準点座標修正データの各情報を、図7に示す属性情報変換テーブル34に基づいて所定の情報コードにそれぞれ変換し、各情報コードを所定のフォーマットに当てはめるものである。
【0047】
文書データ作成部30を構成する情報コード合成手段36は、所定のフォーマットに当てはめられた情報コードを、所定の順序にしたがって、情報合成可能画素抽出手段33によって抽出された情報合成可能画素に付加して、キャリアフォント文字を用いた情報コード合成文書のビットマップデータを作成するものである。
【0048】
文書復元装置3は、図5に示すように、400dpiの解像度を有するスキャナなどの画像入力手段60と、文書ビットマップデータ抽出手段70と、文字認識手段80、情報コード分離手段84、本発明の第2の変換テーブルとしての情報コード変換テーブル85、情報コード変換手段86および修飾手段としての文字・属性情報再構成手段87からなる文字データ復元部88とから構成されており、上記文書作成装置2により作成、出力された印刷物50から、元の文書の文字データをパソコンやワープロ上で復元させるものである。
【0049】
文字データ復元部88を構成する情報コード分離手段84は、文書ビットマップデータ抽出手段70により抽出された文字について、水平方向1ラインごとの走査によって全ての黒画素群を検出した後、各黒画素群のランレングスを計数して情報コードを分離すると共に、情報コード「1」を表す黒画素を白画素に修正しておくものである。すなわち、情報コード分離手段84は、本発明の情報コード抽出手段と情報コード除去手段とを兼ねるものである。
【0050】
文字データ復元部88を構成する文字認識手段80は、情報コード分離手段84により修正された後の、キャリアフォント文字を用いた文書のビットマップデータから、文字(本例においては文字コード)および文字位置基準点の座標を復元するものである。文字認識方法としては、公知の種々の方法を用いることができる。
【0051】
文字データ復元部88を構成する情報コード変換テーブル85には、上記文字作成装置2の属性情報変換テーブル34に格納されている情報と同一のものが格納される。
【0052】
文字データ復元部88を構成する情報コード変換手段86は、情報コード分離手段84によって分離された情報コードを、文字位置基準点の座標が小さい順に1文字分ずつグループ化して、前記所定のフォーマットに応じて当てはめ、情報コード変換テーブル85に基づいて、フォント、サイズ、スタイル、文字位置基準点座標修正データの4つの文字の属性情報に変換(復元)するものである。
【0053】
文字データ復元部88を構成する文字・属性情報再構成手段87は、文字認識手段80により復元された文字コードおよび文字位置基準点の座標と、情報コード変換手段86によって文字位置基準点の座標が小さい順に復元されたフォント、サイズ、スタイル、文字位置基準点座標修正データの4つの文字の属性情報とを対応付けるものである。
【0054】
なお、文字・属性情報再構成手段87の後段に画像出力手段を備え、元の文書を印刷物として復元させるようにしてもよい。
【0055】
次に、文書作成装置2および文書復元装置3からなる紙DIFシステムの作用について説明する。
【0056】
文書作成装置2では、以下のようにしてキャリアフォント文字を用いて文書の印刷物50が出力される。
【0057】
1)先ず文字・属性情報抽出手段20により、ユーザがパソコンやワープロで任意に作成した文書の各文字の文字コード、文字位置基準点の座標、フォント、サイズ、スタイルの5つの属性情報を抽出する。
【0058】
なお、文字・属性情報抽出手段20による属性情報の抽出の際には、文書データの文字レイアウトに合わせて抽出するようにする。具体的には、図6に示す印刷物50に対応する文書データから属性情報を抽出する場合には、印刷物50の左上を走査原点として、右方向を主走査方向、下方向を副走査方向として抽出することとする。走査方向がこれとは異なる場合には、画像データ上で適当な回転処理を行った後に抽出処理を行なうようにする。なお、走査とは、画像データ上でのことを意味し、例えばパソコンなどで作成した文書の画素データをエリアメモリにそのビットマップに対応させて格納し、このメモリ上において走査するとよい。
【0059】
抽出した各文字の属性情報は、文字位置基準点の座標が走査順で小さい文字から順次抽出するものとする。例えば、図6においては、「旅」「行」「日」「時」「一」「月」「十」「日」の順で抽出する。
【0060】
2)次に、文書ビットマップデータ作成手段32において、各文字の文字コードに応じて、キャリアフォント文字フォント記憶手段31に記憶されている所定のキャリアフォント文字のビットマップデータを順次読み出す。そして、文書の各文字の文字位置基準点が配される用紙上の位置に該文字に対応するキャリアフォント文字の文字位置基準点が配されるように、元の文書の大きさに対応する全画素が白のデジタル画像の所定の位置に、読み出したキャリアフォント文字のビットマップデータを順次貼り付ける。これにより、キャリアフォント文字を用いた文書のビットマップデータD1が作成される。
【0061】
このようにして作成されたビットマップデータD1は、キャリアフォント文字のビットマップを構成する水平方向(文書の行方向に相当)1ラインごとの黒画素群の構成画素数,すなわちランレングスが奇数値とされたものとなっている。
【0062】
また、この第1の実施の形態においては、文書復元装置において400dpiの解像度を有する画像入力手段60を使用するものとしているために、ユーザがパソコンやワープロで作成した400dpiのドットの解像度を有する文書から、100dpiのドットの解像度を有する印刷物50を作成するようにしている。これは、印刷物50の画像データを文書ビットマップデータ抽出手段70で正確に抽出するためには、画像入力手段60の解像度が印刷物50のドットの解像度以上を要するためである。よって、文書ビットマップデータ作成手段32によるキャリアフォント文字のビットマップデータの貼り付けは、図6中●で示す400dpi相当の文字位置基準点の座標を変換することによって得られる100dpi相当の文字位置基準点の座標が、図3(a)中○で示すキャリアフォント文字の文字サイズに応じて固有な領域b内の左上頂点画素の座標と一致するように行われる。
【0063】
なお、この第1の実施の形態においては、400dpiから100dpiへの変換により生じるズレ量の情報(以下文字位置基準点座標修正データという)を属性情報とともにキャリアフォント文字に付加しておくことで、文書復元装置3において文字位置基準点の座標を正確に復元することができるようにしている。
【0064】
これは、400dpiのフォント文字を100dpiで表現すると、解像度が1/4になり、文書作成装置2により出力される文字レイアウトの位置精度も1/4に低下するので、例えば、ある文字の原稿上の座標(400dpi)が、主走査方向X=401、副走査方向Y=403であったとき、文書作成装置2により出力された用紙上での座標は、X=100(あまり1)、Y=100(あまり3)になるなど、かっこ内の「あまり」の部分を再現することができない。したがって、文字位置基準点の座標を正確に復元するには、この位置精度の低下分を補正する必要があり、本例においては、文字位置基準点座標修正データとして、前記「あまり」のX座標成分とY座標成分とを示す情報を属性情報とともにキャリアフォント文字に付加しておき、復元の過程において、X座標成分とY座標成分とを使用して、この「あまり」の部分を修正することにしている。
【0065】
3)次に、情報合成可能画素抽出手段33により、キャリアフォント文字を用いた文書の画像領域内での水平方向1ラインごとの走査によって、上記情報合成可能画素としての黒画素群を構成する走査方向最前段の画素に隣接する白画素を抽出する。ただし、この白画素のうち、黒画素に変更することで2つの黒画素群がつながって新しい1つの黒画素群が形成されてしまうものについては、情報コードを合成できない画素として扱う。これは、情報コードを付加することによって、紙出力において元の文字の認識性を落とさないようにするためである。図3(a)のキャリアフォント文字「旅」「行」のビットマップに情報合成可能画素を合わせて示した図を図3(b)に示す。図3(b)中、/が情報合成可能画素を示し、×が2つの黒画素群がつながるため情報コードを合成できない画素を示す。
【0066】
4)さらに属性情報変換手段35により、フォント、サイズ、スタイルおよび文字位置基準点座標修正データの情報を、図7に示す属性情報変換テーブル34に基づいて情報コードに変換した後、所定のフォーマットに当てはめる。
【0067】
具体的には、図8(a)に示すように、フォントの情報をb11,b10,b9 の3ビット(bit)分に、サイズの情報をb8 ,b7 ,b6 の3ビット分に、スタイルの情報をb5 ,b4 の2ビット分に、文字位置基準点座標修正データのうちのY座標成分をb3 ,b2 の2ビット分に、同じくX座標成分をb1 ,b0 の2ビット分に、それぞれ当てはめて12ビットからなるコードデータとする。
【0068】
各文字「旅」「行」「日」「時」「一」「月」「十」「日」についての情報コードを示すデータの一例を図8(b)に示す。
【0069】
5)さらに情報コード合成手段36により、図8(a)に示すフォーマットに当てはめられた情報コードを、b11,…,b0 の順で、情報合成可能画素抽出手段33によって抽出された情報合成可能画素に走査順にしたがって順次付加する。ここで「走査順」とは、図6に示す文書原稿に対応するビットマップ上において、右方向を主走査方向X、下方向を副走査方向Yとし、ラスタースキャンの走査と同じように、左上を走査原点として、先ず主走査を行い、1ライン分の主走査が終了したら次のラインにシフトするような順序である。なお、1文字分の情報コードの付加が終了したら、次の文字の情報コードを引き続き付加するようにする。
【0070】
図3(b)中/で示す各情報合成可能画素と図8(b)に示す各文字の情報コードの各ビットとの対応関係を、図3(b)を拡大して図9に示す。図示するように、図9中の情報合成可能画素の走査順に、各文字の情報コードの各ビットが順に対応するようになっており、「一」のビットb0 以降については、図示しない次の文字の情報合成可能画素と対応し、全ての文字の情報コードが余すところなく対応づけられることとなる。
【0071】
なお、この第1の実施の形態においては、情報コードとして「1」を付加する場合にのみ、情報合成可能画素を黒画素に変更して、黒画素群のランレングスが偶数に変化するようにしている。これにより、キャリアフォント文字を用いた情報コード合成文書のビットマップデータが作成される。
【0072】
情報コード合成後のキャリアフォント文字を用いたビットマップデータの一例を図3(c)に示す。このビットマップデータは、図3(b)中/で示す情報合成可能画素に、図8(b)に示す情報コードを表す画素を付加することにより作成されたものである。なお、「一」のビットb0 以降については、図示しない次の文字に付加され、全ての文字の情報コードが余すところなく付加されることとなる。
【0073】
6)最後に、画像出力手段40により、キャリアフォント文字を用いた情報コード合成済文書のビットマップデータD2に基づいて、該文書の印刷物50を100dpiで出力する。これにより、パソコンなどで作成した文書の元データと略同じレイアウト(文字位置)でキャリアフォント文字が印刷される。
【0074】
なお、この第1の実施の形態においては、後述する文書復元装置3の文書ビットマップデータ抽出手段70によって文書ビットマップデータを正確に抽出することができるように、文書の画像領域サイズおよび解像度に応じたスケール枠55を用紙の縁から数ミリ内側にかけて印刷するようにしている。図10に、このスケール枠55付きの、キャリアフォント文字に情報コードを付加した文書の印刷物50の一例を示す。なお、スケール枠に限らず、その他の基準位置を示す文字や記号を印刷するようにしてもよい。
【0075】
図10から判るように、キャリアフォント文字の一部(図では「旅」や「行」)については元の文字(基礎フォント文字)に比べて、ランレングスを奇数値にしたり情報コードを表す画素を付加するようにしているので、形状が多少変形されているが、文字の認識性を損ねるものではなく、このような印刷物50を見ただけで、ユーザは元の文書の文字内容を容易に確認できる。
【0076】
また、文字の属性情報を属性指定文字の記入ではなく、キャリアフォント文字のビットマップに情報コードとして付加しているので、パソコンなどで作成した文書の元データと略同じ位置に各文字が出力され、元データの文字レイアウトと印刷物上の文字レイアウトとが一致しなくなるという問題が生じることがなく、文書の印刷物を見ただけで、元データや該印刷物から復元される文書内容およびレイアウトを確認することができる。
【0077】
また、第1の文書データ作成方法および装置における文書データ作成過程においては、文字の属性情報を属性指定文字の記入ではなく、キャリアフォント文字のビットマップに情報コードとして付加しているので、元データのレイアウトを崩すことなく属性情報を付加することができ、パソコンなどで作成した文書の元データと略同じ位置に各文字が出力されるので、元データの文字レイアウトと印刷物上の文字レイアウトとが一致しなくなるという問題が生じることがなく、文書の印刷物を見ただけで、元データや該印刷物から復元される文書内容およびレイアウトを確認することができる。
【0078】
一方、文書復元装置3では、以下のようにしてキャリアフォント文字を用いた文書の印刷物50から元の文書のデジタルデータD1が復元される。
【0079】
1)画像入力手段60により、キャリアフォント文字を用いた情報コード合成済文書の印刷物50を400dpiの多値画像データとして読み込む。また、文書ビットマップデータ抽出手段70により、この多値画像データから、該印刷物50のスケール枠55内に存在する100dpiの文書ビットマップデータを抽出する。
【0080】
なお、画像入力手段60による印刷物50の読み込みの際には、印刷物50の文字レイアウトに合わせて読み込むようにする。具体的には、図6に示す印刷物50を読み込む場合には、印刷物50の左上を走査原点として、右方向を主走査方向、下方向を副走査方向として読み取ることとする。読取り方向がこれとは異なる場合には、画像データ上で適当な回転処理を行った後に後述する各処理を行なうようにする。
【0081】
なお、この第1の実施の形態においては、上述のように印刷物50にはスケール枠55が印刷されている。スケール枠55と印刷文字との相対位置は原稿画像を忠実に再現するものであり、印刷物が多少天地左右にずれて画像入力手段60により斜めに読み取られても、周知の位置ズレ補正方法を用いてこの相対位置に基づいて画像データ上で位置ズレを補正することにより、位置ズレのない文書ビットマップデータを抽出することができ、結果として正確な文字認識が可能となる。つまり、スケール枠55は文書ビットマップデータを抽出する際の位置決め用のデータとして機能するものである。
【0082】
2)情報コード分離手段84により、水平方向1ラインごとの走査によって全ての黒画素群を検出する。さらに、各黒画素群のランレングスを計数し、該ランレングスが奇数である場合は情報として「0」、偶数である場合は情報として「1」がそれぞれ付加されていると判断して情報コードを分離する。なお、この情報コードは、文字位置基準点の座標が走査順で小さい文字から順番に分離される。また、この情報コードの分離と共に、ランレングスが偶数であった黒画素群を構成する走査方向最前段の情報コード「1」を表す黒画素を白画素に修正しておく。これにより情報コードを除去した後のキャリアフォント文字を用いた文書のビットマップデータが作成される。
【0083】
3)文字認識手段80において、情報コード分離手段84によって情報コードを除去した後のキャリアフォント文字を用いた文書のビットマップデータと不図示の照合用テーブルとに基づいて、文字コードおよび100dpi相当の文字位置基準点の座標を復元する。
【0084】
4)情報コード変換手段86により、情報コード分離手段84によって分離された情報コードを、1文字分ずつ、すなわち12ビットずつグループ化して、図8(a)に示すフォーマットにb11,…,b0 の順で当てはめる。さらに、図7に示す情報コード変換テーブル85に基づいて所定の属性情報に変換する。これにより、文字位置基準点の座標が走査順で小さいものから順に、フォント、サイズ、スタイル、および文字位置基準点座標修正データの5つの属性情報を復元する。
【0085】
5)文字・属性情報再構成手段87において、100dpi相当の文字位置基準点の座標が小さい順に情報コード変換手段86によって復元されたフォント、サイズ、スタイル、文字位置基準点座標修正データの情報とを対応付ける。具体的には、文字コードおよび100dpi相当の文字位置基準点の座標を、該文字位置基準点の座標の小さい順に並び替えて、フォント、サイズ、スタイルおよび文字位置基準点座標修正データと対応付けて、フォント、サイズ、あるいはスタイルに応じた文字のビットマップデータを配置する。また、100dpi相当の文字位置基準点の座標と文字位置基準点座標修正データとから、400dpi相当の文字位置基準点の座標を復元する、つまり元の文書データの文字と同じ位置に文字のビットマップデータが配置されるようにする。
【0086】
これにより、文字コードの記述からなる、元の文書のデジタルデータを、パソコンやワープロ上で属性情報も含めて正確に復元させることができる。つまり、文字(本例では文字コード)の復元はキャリアフォント文字に基づいて行なっており、少なくとも、従来の文字認識技術と同じレベルの認識率で文書のデジタルデータを正確に復元させることができるし、フォント、サイズ、あるいはスタイルなどの属性情報を失うこともない。また、文字の基準位置情報も含めて復元するようにしているので、文字が配されるべき位置についても正確に復元することができ、復元されたデジタルデータに基づいて再出力した画像上や印刷物上においても、元の文書とほぼ同じレイアウトでその内容を確認することができる。
【0087】
さらに、文書のデジタルデータを文書内容だけでなく属性情報も含めて復元するようにしているので、結果として、パソコンなどで作成した文書を紙出力のみで管理することができるようになるので、二重管理という問題を生じることがない文書管理方法にすることができる。
【0088】
次に、本発明に係る文書データ作成部を備えた文書作成装置および本発明に係る文書データ復元部を備えた文書復元装置の第2の実施の形態について説明する。
【0089】
この第2の実施の形態による文書作成装置2および文書復元装置3は、基本的には上記第1の実施の形態におけるものと同様の構成を備えている。異なるのは、第1の実施の形態ではユーザが作成した文書の各文字の全ての属性情報をキャリアフォント文字に付加するのに対し、第2の実施の形態では圧縮して付加し、この圧縮して付加された属性情報を復元するという点である。以下、この点について説明する。
【0090】
図11は文書作成装置の概略構成を示すブロック図である。なお、文書復元装置の構成は、第1の実施の形態におけるものと同じである。
【0091】
通常、ユーザが任意に作成した文書では、図6に示すように、行単位または段落単位で、同一のフォント、サイズ、スタイルを有する文字が使用されていることが多い。この場合、キャリアフォント文字には、フォント、サイズ、スタイルに関して同一の情報コードが行単位または段落単位で繰り返し付加されることになる。
【0092】
そこで、第2の実施の形態においては、図11に示すように、属性情報変換手段35と情報コード合成手段36との間に情報コード圧縮手段37を設け、属性情報変換手段35によって得られた情報コードを圧縮した後に、圧縮済情報コードをキャリアフォント文字に付加するようにしている。具体的には、情報コードを、文字位置基準点座標修正データ(x座標、y座標)のように文字によって固有な情報(以下固有情報という)と、フォント、サイズ、スタイルのように行単位または段落単位で同一であることの多い情報(以下非固有情報という)とに分離し、図12(a)(b)に示すフォーマットに当てはめる。さらに、各文字について、走査順で1つ前の文字と非固有情報が同一であるか否かを判定し、同一であると判定した場合は、該各文字の非固有情報を消去して情報コードを圧縮する。なお、文書復元処理の際、非固有情報が消去された情報コードから元の全情報コードを復元するために、判定結果を非固有情報変更フラグとして図8(a)に示すフォーマットに付加している。第2の実施の形態においては、判定結果が同一である場合のフラグを「0」、異なる場合のフラグを「1」に設定している。
【0093】
各文字「旅」「行」「日」「時」「一」「月」「十」「日」についての圧縮済情報コードを示すデータの一例を図12(c)に示す。図8(b)と図12(c)とを比較すると判るように、図6に示した文書を復元するには、上記第1の実施の形態で用いる情報コードのフォーマットの場合は図8(b)に示すように96ビットのデータが必要になるになるのに対して、第2の実施の形態では64ビットの情報コードで文書の復元が可能になっていることから情報コードの圧縮ができることが確認できる。
【0094】
図13に、情報コード合成後のビットマップデータの一例を示す。このビットマップデータは、図3(b)に示す情報合成可能画素に、図12(c)に示す情報コードを順次付加することにより作成されたものである。
【0095】
一方で、図5に示す文書復元装置3の情報コード変換手段86において、情報コードの属性情報への変換前に、情報コード分離手段84によって分離された情報コードを非固有情報変更有無フラグの情報に応じて図8(a)に示すフォーマットに編集し直す。具体的には、1ビット目の非固有情報変更有無フラグの情報が「1」である文字に対しては、固有情報として続く4ビットの情報を、非固有情報としてさらに続く8ビットの情報を分離して図8(a)に示すフォーマットに当てはめる。一方、1ビット目の非固有情報有無フラグの情報が「0」である場合は、固有情報として続く4ビットの情報を分離するとともに、非固有情報として該走査順で1つ前の文字の非固有情報を複写して、同フォーマットに当てはめる。つまり、この第2の実施の形態における情報コード変換手段86は、本発明の情報コード復元手段を兼ねるものとして機能する。これにより、属性情報の復元を、上記第1の実施の形態と同様にして行なうことが可能になる。
【0096】
以上のように、第2の実施の形態においては、情報コードを圧縮してキャリアフォント文字に付加するため、同一の情報量を復元するためにキャリアフォント文字に付加すべき情報コード数を、第1の実施の形態の場合に比べて縮小できる。換言すれば、第1の実施の形態の場合に比べて復元できる情報量が増加する。これにより、属性情報として、フォント、サイズ、スタイルの情報に加え、例えばアンダーライン指定や倍角指定などの多種の情報を付加して復元することもできるようになる。
【0097】
なお、上記各実施の形態においては、文書作成装置2に画像出力手段40を内蔵しているが、別体の構成にしてもよい。また、文書復元装置3における画像入力手段60についても同様である。
【0098】
また、上記各実施の形態においては、文字原稿を例にして説明したが、例えば罫線が含まれるような原稿においても、罫線を構成する“─”,“│”,“┌”,“ ┐”,“┘”,“└”,“├”,“ ┤”,“┴”,“ ┬”,“ ┼”といった記号を文字の場合と同様に規則化して、キャリアフォント文字に組み入れておき、さらに属性情報に罫線の太さや、破線等のスタイルを加えることで、文字原稿と同様に罫線を含む原稿にも本発明を利用することができるようになる。
【0099】
なおキャリアフォント文字は一種類である必要はない。前記文字情報に文字コードと文字位置だけではなく、フォント、サイズも含め、各フォントに対応するキャリアフォント文字を複数のサイズ分持たせてもよい。こうすれば、本装置で作成されたビットマップデータは、元の文書原稿をより忠実に反映するものとなる。文字の情報のうち何を属性情報とするかは、生成されるビットマップデータの原稿に対する忠実さの度合いと、キャリアフォント文字フォント記憶手段の容量とのバランスによって決めればよい。
【0100】
また、文書復元装置において、情報コードを圧縮することなくキャリアフォント文字に付加したものと、圧縮済情報コードをキャリアフォント文字に付加したもののいずれにも対応することができるようにするには、いずれの形態で情報コードを付加したのかを示すフラグを追加するとよい。通常は1文書ごとに圧縮済とするか否かであるので、このフラグは、1つの文書において、最初の文字の情報コードの先頭ビットb11の前に1つだけ付加するだけで十分である。
【0101】
また、上記各実施の形態においては、従来のフォント文字を基礎フォント文字として使用し、キャリアフォント文字を作成するものとして説明したが、この基礎フォント文字は、どのようなフォント文字を使用してもよく、今後出現する新たなフォント文字を使用することもできる。例えば、本出願人が特願2000−82156号において提案している専用フォント文字を使用することもできる。この場合、文字認識手段80などの専用フォント文字と関連する部分については上記特願2000−82156号に記載のものとするのはいうまでもない。
【0102】
以上説明したように、上記実施の形態による紙DIFシステムにおいては、文書作成装置2において作成された文書の印刷物50を見ただけで、ユーザは文書の内容を文字だけでなく属性も含めて確認できるし、また、文書復元装置3において、文書作成装置2により作成された文書の印刷物50から、元の文書をパソコンやワープロ上で正確に復元させることができる。
【0103】
したがって、本発明を文書管理の方法として利用することによって、文書情報を紙出力のみで管理することができるようになるので、文書内容の確認や検索が容易にでき、また文書のデジタルデータを誤りなく復元でき、さらに、二重管理という問題を生じることがない文書管理方法を確立することができる。
【図面の簡単な説明】
【図1】キャリアフォント文字のビットマップを作成する装置の構成を示すブロック図
【図2】キャリアフォント文字を作成する方法を示すフローチャート
【図3】基礎フォント文字からキャリアフォント文字を作成する方法を示す図であって、基礎フォント文字のビットマップデータの一例を示した図(a)、情報合成可能画素を合わせて示した図(b)、情報コードを合成した後のビットマップデータの一例を示した図(c)
【図4】本発明の第1の実施の形態による文書作成装置の概略構成を示すブロック図
【図5】本発明の第1の実施の形態による文書復元装置の概略構成を示すブロック図
【図6】文書原稿の一例を示す図
【図7】属性情報と情報コードとの対応関係の一例を示した図
【図8】第1の実施の形態における情報コードのフォーマットの一例を示した図
【図9】図3(b)中/で示す各情報合成可能画素と図8(b)に示す各文字の情報コードの各ビットとの対応関係を示した拡大図
【図10】キャリアフォント文字に情報コードを付加した文書の一例を示す図
【図11】本発明の第2の実施の形態による文書作成装置の概略構成を示すブロック図
【図12】第2の実施の形態における情報コードのフォーマットの一例を示した図(a),(b)、圧縮済情報コードを示すデータの一例(c)
【図13】情報コードを合成した後のビットマップデータの一例を示した図
【符号の説明】
1 ビットマップフォント作成装置
2 文書作成装置
3 文書復元装置
10 基礎フォント文字記憶手段
11 キャリアフォント文字作成手段
20 文字・属性情報抽出手段
30 文書データ作成部
31 キャリアフォント文字記憶手段
32 ビットマップデータ作成手段
33 情報合成可能画素抽出手段
34 属性情報変換テーブル
35 属性情報変換手段
36 情報コード合成手段
40 画像出力手段
50 印刷物
60 画像入力手段
70 文書ビットマップデータ抽出手段
80 文字認識手段
85 情報コード変換テーブル
86 情報コード変換手段
87 文字・属性情報再構成手段
88 文字データ復元部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a method and apparatus for creating bitmap data of a document created by a personal computer or a word processor, and a method and apparatus for restoring character data from a bitmap.
[0002]
[Prior art]
Conventionally, digital data (character code of each character and information on the printing position) of a document arbitrarily created by a user with a personal computer (hereinafter referred to as a personal computer) or a word processor (hereinafter referred to as a word processor) is stored or carried. As recording media (storage media) capable of recording, floppy disks, CD-ROMs, and the like are widely known. The content of a document recorded on this type of recording medium can be restored without error by using a device corresponding to the recording medium, for example, a personal computer or word processor equipped with a reading device such as an FD drive device or a CD-ROM drive device. be able to.
[0003]
However, in order to find a medium in which a desired document is recorded (so-called search) from a large number of storage media in a stored state, the recorded documents are sequentially ordered by file name using a personal computer or word processor. It needs to be read and displayed on the screen to check the contents. However, such a method has a problem that work efficiency is poor.
[0004]
On the other hand, in order to check the contents of a document by using the time during carrying (handling), carry a portable reading device having a display unit together with a recording medium, or carry a printed matter (paper medium) of the document. There is a need. However, in the method of carrying the reading device, there is a problem that the device having a display screen that is not difficult to see is too large or too heavy to carry. In the method of carrying the printed material, both the recording medium and the printed material are used. There is a problem in that double management occurs.
[0005]
Therefore, as a method for solving the above-described problems, the document is handled only by printed matter, and the digital data of the document is obtained by recognizing the characters of the printed matter by using various known character recognition methods. It is possible to restore.
[0006]
At this time, as proposed in, for example, JP-A-62-243087, not only character codes and character positions (hereinafter referred to as character information) but also characters such as underline, double angle, font, size, or style are used. It is also conceivable to restore together with information indicating attributes (hereinafter referred to as attribute information).
[0007]
Here, the method proposed in the above-mentioned Japanese Patent Application Laid-Open No. Sho 62-243087 is a method in which, in addition to characters indicating the document content on a sheet, for example, when double-size characters are specified, a double-enclosed BS is used. In the case of designation, an attribute designation character indicating the attribute information such as a circled US is entered immediately before the character whose attribute changes, and when the attribute designation character is recognized during character recognition, this attribute designation character Based on the information, the characters indicating the document content are modified, such as underlining or double-width characters.
[0008]
If this method is used, documents created on a personal computer or the like can be managed only by paper output, so it is easy to check and search the document content, and the digital data of the document can be attributed in addition to the document content. It is possible to restore the document including information, and to make a document management method that does not cause the problem of double management.
[0009]
[Problems to be solved by the invention]
However, in the method proposed in the above Japanese Patent Laid-Open No. 62-243087, the attribute designation character is entered immediately before the character whose attribute changes, so the character layout of the original data (position where the character is arranged) and the printed matter There is a problem that the character layout does not match. For this reason, just looking at the characters on the printed matter may cause a problem that it is impossible to notice an error in the layout of the original data or the restored document or a poor balance.
[0010]
The present invention has been made in view of the above circumstances, can easily check and search document contents, can restore digital data of documents including attribute information as well as document contents, and is also called double management. Bitmap data for character recognition documents that can confirm the original data and the document contents and layout restored from the printed material simply by looking at the printed material when realizing a document management method that does not cause a problem It is an object of the present invention to provide a method and apparatus for creating a character, and a method and apparatus for restoring character data from a bitmap.
[0011]
[Means for Solving the Problems]
A first document data generation method according to the present invention is a document data generation method for generating bitmap data of a document based on document original data generated by a computer, and information on each character constituting the document original data. Character information and attribute information are extracted from the character information according to the extracted character information.Carrier with basic font characters modifiedBitmap data corresponding to the document manuscript data is created using a font character bitmap, and attribute information of each extracted character is stored.TheAttribute information andRepresents the attribute informationInformation codeWhenIs converted into the information code based on the first conversion table representing the correspondence ofPixels that meet the specified conditionsThe information code is extracted as a synthesizeable pixel that can be synthesized, and the information code is sequentially added to the synthesizeable pixel.
[0012]
In the second document data creation method according to the present invention, when an information code is added (synthesized) to bitmap data of a document created in the same manner as the first document data creation method, the information code is added after being compressed. The character information and the attribute information are extracted from the information of each character constituting the document manuscript data, and according to the character information of each extracted character,Carrier with basic font characters modifiedBitmap data corresponding to the document manuscript data is created using a font character bitmap, and attribute information of each extracted character is stored.TheAttribute information andRepresents the attribute informationInformation codeWhenThe information code is converted into the information code based on the first conversion table representing the correspondence of the information, and the information code is separated into specific information unique to the character and non-unique information that is the same in line units or paragraph units. And deleting the non-unique information of consecutive characters among the characters constituting the document document data, compressing the information codes of the consecutive characters to generate a compressed information code, and the created bitmap Of each pixel of dataPixels that meet the specified conditionsThe compressed information code is extracted as a synthesizeable pixel that can be synthesized, and the compressed information code is sequentially added to the synthesizeable pixel.
[0013]
Here "compression" is,SentenceOnly the information code for a predetermined character may be compressed so that the amount of all information codes for all characters of the book is reduced.
[0014]
Also, “Career"Font characters"The carrierA character data restoration process that is convenient for recognizing whether an information code is added or not in a character data restoration process to be described later when an information code is added to a font character bitmap. As long as it can be recognized whether or not the information code is added in the above, any type may be used, and it may be obtained by transforming a conventionally used character. Good.
[0015]
Further, the “synthesizeable pixel capable of synthesizing the compressed information code” is a pixel that is convenient for recognizing whether or not it is a pixel to which an information code is added in the character data restoration process described later, Any pixel may be used as a compositable pixel as long as it can be recognized whether or not the information code is added in the character data restoration process.. It should be noted that it is desirable to add an information code so as not to deteriorate the recognizability of the original character.
Alternatively, the carrier font character is modified so that the run length of the black pixel group arranged on the line in the scanning direction becomes an odd value, and the compositible pixel is a black pixel arranged on the line in the scanning direction. The white pixel may be a white pixel adjacent to the group and the two black pixel groups are not connected even if the white pixel is changed to a black pixel.
[0016]
On the other hand, a first character data restoration method according to the present invention is a method for restoring character data of a document from bitmap data of a document created by using the first document data creation method. mapAdded to the synthesizable pixel inExtracting the information code;Indicates the correspondence between the information code and the attribute informationConverting the extracted information code into attribute information with reference to a second conversion table;TheThe extracted information code is removed from the bitmap of the document, and based on the bitmap from which the information code is removedSentenceCharacter information is restored.
Further, when the carrier font character is modified so that the run length of the black pixel group arranged on the line in the scanning direction becomes an odd value, it is created using the first document data creation method. The information code is extracted based on whether the run length of the black pixel group arranged on the line in the scanning direction is an even value or an odd value from the bit map of the document, and the correspondence between the information code and the attribute information is determined. The extracted information code is converted into attribute information with reference to the second conversion table to be represented, the extracted information code is removed from the bitmap of the document, and the character based on the bitmap from which the information code is removed The information may be restored.
[0017]
A second character data restoration method according to the present invention is a method for restoring character data of a document from a document bitmap created by using the second document data creation method.Added to the synthesizable pixel inExtracting the compressed information code;TheRestore the extracted compressed information code before compressionSaidAsk for an information codeIndicates the correspondence between the information code and the attribute informationConverting the obtained information code into attribute information with reference to a second conversion table;SaidThe extracted compressed information code is removed from the bitmap of the document, and the compressed information code is removed based on the removed bitmap.SentenceCharacter information is restored.
Further, when the carrier font character is modified so that the run length of the black pixel group arranged on the line in the scanning direction has an odd value, it is created using the second document data creation method. The compressed information code is extracted based on whether the run length of the black pixel group arranged on the line in the scanning direction is an even value or an odd value from the bitmap of the document, and the extracted compressed information code is The information code before compression is obtained by restoration, the obtained information code is converted into attribute information by referring to a second conversion table representing the correspondence between the information code and the attribute information, and the extracted compressed information is obtained. The code may be removed from the bitmap of the document, and the character information may be restored based on the bitmap from which the compressed information code is removed.
[0018]
In the first and second character data restoration methods, it is desirable that the restored character information is modified based on the converted attribute information.
[0019]
A first document data creation device according to the present invention is a device that implements the first document data creation method, that is, a document data creation device that creates bitmap data of a document based on document original data created by a computer. BecauseCarrier with basic font characters modifiedStore font character bitmap dataCareerFont character storage means, character / attribute information extraction means for extracting character information and attribute information from information of each character constituting the document manuscript data, and depending on the character information of each extracted character,CareerFrom font character storage meansCareerBitmap data creation means for reading out bitmaps of font characters and creating bitmap data corresponding to the document original data, and attribute information of each extracted characterTheAttribute information andRepresents the attribute informationInformation codeWhenAttribute information conversion means for converting to the information code based on the first conversion table representing the correspondence of the pixel, and among the pixels of the created bitmap dataPixels that meet the specified conditionsIt comprises information synthesizable pixel extracting means for extracting the information code as a synthesizable pixel capable of synthesizing, and information code synthesizing means for sequentially adding the information code to the synthesizable pixel. is there.
[0020]
A second document data creation device according to the present invention is a device that implements the second document data creation method, that is, a document data creation device that creates bitmap data of a document based on document original data created by a computer. BecauseCarrier with basic font characters modifiedStore font character bitmap dataCareerFont character storage means, character / attribute information extraction means for extracting character information and attribute information from information of each character constituting the document manuscript data, and depending on the character information of each extracted character,CareerFrom font character storage meansCareerBitmap data creation means for reading out bitmaps of font characters and creating bitmap data corresponding to the document original data, and attribute information of each extracted characterTheAttribute information andRepresents the attribute informationInformation codeWhenAttribute information conversion means for converting the information code into the information code based on the first conversion table representing the correspondence between the information code and the unique information unique to the character and the non-unique information that is the same in line unit or paragraph unit An information code that is separated and that erases the non-unique information of consecutive characters of the characters constituting the document document data and compresses the information code of the consecutive characters to generate a compressed information code Of the compression means and each pixel of the created bitmap dataPixels that meet the specified conditionsAn information synthesizable pixel extracting means for extracting the compressed information code as a synthesizable pixel capable of synthesizing, and an information code synthesizing means for sequentially adding the compressed information code to the synthesizable pixel. It is what.
[0021]
A first character data restoration device according to the present invention is a device for performing the first character data restoration method, that is, character data of a document from a bitmap of a document created by the first document data creation device. A character data restoration device that restores a document bitmapAdded to the synthesizable pixel inInformation code extracting means for extracting the information code;Indicates the correspondence between the information code and the attribute informationAn information code converting means for converting the extracted information code into attribute information with reference to a second conversion table; an information code removing means for removing the extracted information code from the bitmap of the document; and Based on removed bitmapSentenceCharacter recognition means for restoring character information is provided.
Further, when the carrier font character is modified so that the run length of the black pixel group arranged on the line in the scanning direction becomes an odd value, the document created by the first document data creating apparatus is Information code extracting means for extracting the information code based on whether the run length of the black pixel group arranged on the line in the scanning direction from the bitmap is an even value or an odd value, and the information code and the attribute information An information code converting means for converting the extracted information code into attribute information with reference to a second conversion table representing correspondence; an information code removing means for removing the extracted information code from the bitmap of the document; Character recognition means for restoring character information based on the bitmap from which the information code has been removed may be provided.
[0022]
A second character data restoration device according to the present invention restores character data of a document from a device that implements the second character data restoration method, that is, a document bitmap created by the second document data creation device. Character data restoration device, which is a document bitmapAdded to the compositable pixels inAn information code extracting means for extracting the compressed information code;TheRestore the extracted compressed information code before compressionSaidAn information code restoring means for obtaining an information code;Indicates the correspondence between the information code and the attribute informationRefer to the second conversion tableSaidRestored information codeSaidInformation code conversion means for converting into attribute information;SaidInformation code removing means for removing the extracted compressed information code from the bitmap of the document, and based on the bitmap from which the compressed information code has been removedSentenceCharacter recognition means for restoring character information is provided.
Further, when the carrier font character is modified so that the run length of the black pixel group arranged on the line in the scanning direction becomes an odd value, the document created by the second document data creating apparatus is Information code extracting means for extracting the compressed information code based on whether the run length of the black pixel group arranged on the line in the scanning direction from the bitmap is an even value or an odd value, and the extracted compressed information Information code restoring means for restoring the code to obtain the information code before compression, and converting the restored information code into the attribute information with reference to a second conversion table representing the correspondence between the information code and the attribute information Information code converting means, information code removing means for removing the extracted compressed information code from the bitmap of the document, and the compressed information code being removed. Or it may be provided with a character recognition means for restoring the character information based on the bitmap.
[0023]
In the first and second character data restoration devices according to the present invention, it is desirable that the first and second character data restoration devices further include modification means for modifying the restored character information based on the converted attribute information.
[0024]
【The invention's effect】
According to the first document data creation method and apparatus and the first character data restoration method and apparatus (hereinafter collectively referred to as the first invention) according to the present invention, in the document data creation process, each character constituting the document manuscript Character information and attribute information are extracted from the information of the document, and an information code representing the extracted attribute information is added to the bitmap data corresponding to the document manuscript created according to the extracted character information. The information code of each character is extracted from the bitmap, and the information code is converted into attribute information by referring to the conversion table. On the other hand, character recognition is performed based on the bitmap after the information code is removed to obtain the character information. Since it is restored, the digital data of the original document can be accurately restored including the attribute information.
[0025]
As described above, according to the first aspect of the invention, the digital data of the document can be restored including not only the document contents but also the attribute information. As a result, the document created on the personal computer or the like is output to paper. Therefore, it is possible to make a document management method that does not cause the problem of double management.
[0026]
In the document data creation process in the first document data creation method and apparatus, the character attribute information is added as an information code to the bitmap of the carrier font character instead of entering the attribute designation character. Attribute information can be added without destroying the layout of the document, and each character is output at approximately the same position as the original data of the document created on a personal computer, etc., and the character layout of the original data matches the character layout on the printed matter. The problem of disappearance does not occur, and it is possible to confirm the original data and the document content and layout restored from the printed material simply by looking at the printed material.
[0027]
According to the second document data creation method and apparatus and the second character data restoration method and apparatus (hereinafter collectively referred to as the second invention) according to the present invention, the information code is compressed in the document data creation process. A compressed information code is added later by a method similar to that of the first invention, and the compressed information code extracted from the document bitmap is restored to the original information code in the character data restoration process. Since attribute information and character information are obtained by the same method, the number of information codes for restoring the same information amount can be reduced as compared with the case where the information code is not compressed, and the amount of attribute information that can be restored is the first. There is an effect that it increases compared to the first invention.
[0028]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0029]
FIG. 1 is a block diagram showing a configuration of an apparatus for creating a bitmap of a carrier font character used in each apparatus for executing a document data creation method and a character data restoration method according to an embodiment of the present invention to be described later.
[0030]
As shown in FIG. 1, this bitmap
[0031]
Carrier font characters with odd run lengths may have odd values for all run lengths of the conventional font characters themselves, but if not, bitmaps are created using the conventional font characters as basic font characters. After that, it can be created by applying a minute deformation using a method described later. The reason why the run length is made odd is to add (synthesize) the character attribute information to the character bitmap as binary data so that the added binary data can be restored (separated). (Details will be described later).
[0032]
Next, a method for creating a bitmap font by the bitmap
[0033]
1) First, the carrier font character creating means 11 is a general font having a specific font character (basic font character), size, and style which is stored in the basic font character storage means 10 and serves as a basis of the carrier font character. Any one character data is selected and read from a set of basic font characters (font data). Then, scanning is performed for each line in the horizontal direction within a unique region according to the character size of the read basic font character (step 1), and black pixels are detected (step 2). Further, the run length of the black pixel group starting from the detected black pixel is counted (step 3).
[0034]
Here, the unique area may be a rectangular area with dotted lines around the characters in FIG. Scanning means on image data. For example, pixel data of basic font characters may be stored in an area memory in correspondence with the bitmap and scanned on this memory.
[0035]
It is determined whether or not the run length of the black pixel group counted in
[0036]
2) When it is determined in
[0037]
Then, by performing the above processing for all basic font characters, font data of carrier font characters is created. The created font data may be recorded and distributed on a computer-readable medium such as a CD-ROM. FIG. 3A shows an example of bitmap data of each carrier font character for the Chinese characters “travel” and “line”.
[0038]
Thus, if the above method is used, bit map data of carrier font characters can be created by a simple method.
[0039]
Next, a document creation apparatus having a document data creation section according to the present invention, and a document creation apparatus, which creates bitmap data of a document using a bitmap font composed of carrier font characters created as described above A first embodiment of a document restoration apparatus provided with a document data restoration unit according to the present invention for restoring character data of a document from a printed matter created and output in accordance with the first embodiment will be described. The document creation device and the document restoration device are collectively referred to as a paper digital interface system (hereinafter referred to as a paper DIF system).
[0040]
FIG. 4 is a block diagram showing a schematic configuration of the document creation device, FIG. 5 is a block diagram showing a schematic configuration of the document restoration device, and FIG. 6 is a diagram showing an example of a document original created by a personal computer or a word processor.
[0041]
As shown in FIG. 4, the
[0042]
The carrier font character storage means 31 constituting the document
[0043]
The document bitmap data creation means 32 constituting the document
[0044]
Here, the coordinates of the character position reference point may be predetermined coordinates in a unique area according to the character size. In this example, dotted lines are added around each character indicated by ● in FIG. The coordinates of the upper left vertex pixel in the rectangular area a. However, the present invention is not limited to this, and other coordinates may be used as the coordinates of the character position reference point as long as the reference position of the character can be determined.
[0045]
The information synthesizable pixel extraction means 33 constituting the document
[0046]
The attribute information conversion means 35 constituting the document
[0047]
The information
[0048]
As shown in FIG. 5, the
[0049]
The information
[0050]
The
[0051]
The information code conversion table 85 constituting the character
[0052]
The information code conversion means 86 constituting the character
[0053]
The character / attribute
[0054]
Note that an image output unit may be provided after the character / attribute
[0055]
Next, the operation of the paper DIF system including the
[0056]
The
[0057]
1) First, the character / attribute information extraction means 20 extracts five attribute information of a character code, character position reference point coordinates, font, size, and style of a document arbitrarily created by a user using a personal computer or word processor. .
[0058]
When the attribute information is extracted by the character / attribute
[0059]
It is assumed that the extracted attribute information of each character is sequentially extracted from characters whose coordinates of the character position reference point are small in the scanning order. For example, in FIG. 6, “Journey”, “Line”, “Day”, “Time”, “One”, “Month”, “Ten”, and “Day” are extracted in this order.
[0060]
2) Next, the document bitmap data creation means 32 sequentially reads out bitmap data of predetermined carrier font characters stored in the carrier font character font storage means 31 according to the character code of each character. Then, the character position reference point of the carrier font character corresponding to the character is placed at the position on the paper where the character position reference point of each character of the document is placed. The bitmap data of the read carrier font characters is sequentially pasted at a predetermined position of the digital image with white pixels. As a result, document bitmap data D1 using carrier font characters is created.
[0061]
The bitmap data D1 thus created has an odd number of pixels constituting the black pixel group for each horizontal direction (corresponding to the row direction of the document) constituting the bitmap of the carrier font character, that is, the run length. It has become that.
[0062]
Further, in the first embodiment, since the image input means 60 having a resolution of 400 dpi is used in the document restoration apparatus, a document having a resolution of 400 dpi dots created by a user with a personal computer or word processor. Therefore, a printed
[0063]
In the first embodiment, information on the amount of deviation caused by the conversion from 400 dpi to 100 dpi (hereinafter referred to as character position reference point coordinate correction data) is added to the carrier font character along with the attribute information. In the
[0064]
This is because, when a 400 dpi font character is expressed at 100 dpi, the resolution becomes ¼ and the positional accuracy of the character layout output by the
[0065]
3) Next, by the information synthesizable
[0066]
4) Further, the attribute information conversion means 35 converts the font, size, style, and character position reference point coordinate correction data information into an information code based on the attribute information conversion table 34 shown in FIG. Apply.
[0067]
Specifically, as shown in FIG.11, B10, B9Size information in 3 bits (bit)8, B7, B6Style information is b in 3 bits of5, B4The Y coordinate component of the character position reference point coordinate correction data is b3, B2Similarly, the X coordinate component is set to b for 2 bits of1, B0The code data consisting of 12 bits is applied to each of the 2 bits.
[0068]
FIG. 8B shows an example of data indicating information codes for each character “journey” “line” “day” “hour” “one” “month” “ten” “day”.
[0069]
5) Further, an information code applied to the format shown in FIG.11, ..., b0Are sequentially added to the information synthesizable pixels extracted by the information synthesizable pixel extracting means 33 according to the scanning order. Here, “scanning order” means that the right side is the main scanning direction X and the downward direction is the sub-scanning direction Y on the bitmap corresponding to the document document shown in FIG. First, the main scanning is performed with the scanning origin as the scanning origin, and when the main scanning for one line is completed, the order is shifted to the next line. When the addition of the information code for one character is completed, the information code for the next character is continuously added.
[0070]
FIG. 9 is an enlarged view of FIG. 3B showing the correspondence between each information compositible pixel indicated by / in FIG. 3B and each bit of the information code of each character shown in FIG. 8B. As shown in the drawing, each bit of the information code of each character corresponds to the scanning order of the information synthesizable pixels in FIG.0In the following, the information compositing pixel of the next character (not shown) is associated, and the information codes of all the characters are associated with each other.
[0071]
In the first embodiment, only when “1” is added as the information code, the information synthesizable pixel is changed to a black pixel so that the run length of the black pixel group changes to an even number. ing. Thereby, bitmap data of the information code composite document using the carrier font characters is created.
[0072]
FIG. 3C shows an example of bitmap data using carrier font characters after information code synthesis. This bitmap data is created by adding a pixel representing the information code shown in FIG. 8B to the information synthesizable pixel indicated by / in FIG. 3B. The bit b of “one”0After that, it is added to the next character (not shown), and the information codes of all characters are completely added.
[0073]
6) Finally, the image output means 40 outputs the printed
[0074]
In the first embodiment, the image area size and resolution of the document are set so that document bitmap data can be accurately extracted by the document bitmap data extraction means 70 of the
[0075]
As can be seen from FIG. 10, for some of the carrier font characters (“journey” and “line” in the figure), the run length is set to an odd value or a pixel representing an information code compared to the original character (basic font character). However, the shape is slightly deformed, but this does not impair the recognizability of the characters. The user can easily understand the character contents of the original document simply by looking at such a printed
[0076]
In addition, since the character attribute information is added as an information code to the bitmap of the carrier font character instead of entering the attribute designation character, each character is output at approximately the same position as the original data of the document created on a personal computer or the like. Thus, the problem that the character layout of the original data does not match the character layout on the printed material does not occur, and the document content and layout restored from the printed data can be confirmed simply by looking at the printed material of the document. be able to.
[0077]
In the document data creation process in the first document data creation method and apparatus, the character attribute information is added as an information code to the bitmap of the carrier font character instead of entering the attribute designation character. Attribute information can be added without destroying the layout of the document, and each character is output at approximately the same position as the original data of the document created on a personal computer, etc., so the character layout of the original data and the character layout on the printed matter There is no problem that they do not match, and it is possible to confirm the original data and the document contents and layout restored from the printed material simply by looking at the printed material.
[0078]
On the other hand, in the
[0079]
1) The printed
[0080]
When the printed
[0081]
In the first embodiment, the scale frame 55 is printed on the printed
[0082]
2) The information code separation means 84 detects all black pixel groups by scanning every horizontal line. Further, the run length of each black pixel group is counted. If the run length is an odd number, it is determined that “0” is added as information, and if it is an even number, “1” is added as information. Isolate. Note that this information code is sequentially separated from the character whose coordinates of the character position reference point are in the scanning order. In addition to the separation of the information code, the black pixel representing the information code “1” at the forefront stage in the scanning direction constituting the black pixel group having an even run length is corrected to a white pixel. Thereby, bitmap data of the document using the carrier font character after the information code is removed is created.
[0083]
3) In the
[0084]
4) The information code separated by the information code separating means 84 is grouped by one character, that is, 12 bits by the information
[0085]
5) In the character / attribute
[0086]
Thereby, the digital data of the original document composed of the description of the character code can be accurately restored on the personal computer or word processor including the attribute information. In other words, the character (character code in this example) is restored based on the carrier font character, and at least the digital data of the document can be accurately restored with the same recognition rate as the conventional character recognition technology. You won't lose attribute information such as font, size, or style. In addition, since the information including the reference position information of the character is restored, the position where the character is to be placed can be restored accurately, and the image or printed matter is re-output based on the restored digital data. In the above, the content can be confirmed with the same layout as the original document.
[0087]
Furthermore, since the digital data of the document is restored including not only the document content but also the attribute information, the document created on a personal computer or the like can be managed only by paper output. A document management method that does not cause the problem of heavy management can be achieved.
[0088]
Next, a second embodiment of the document creation apparatus provided with the document data creation unit according to the present invention and the document restoration apparatus provided with the document data restoration unit according to the present invention will be described.
[0089]
The
[0090]
FIG. 11 is a block diagram showing a schematic configuration of the document creation apparatus. The configuration of the document restoration apparatus is the same as that in the first embodiment.
[0091]
Normally, in a document arbitrarily created by a user, characters having the same font, size, and style are often used in units of lines or paragraphs as shown in FIG. In this case, the same information code regarding the font, size, and style is repeatedly added to the carrier font character in units of lines or paragraphs.
[0092]
Therefore, in the second embodiment, as shown in FIG. 11, an information
[0093]
FIG. 12C shows an example of data indicating the compressed information code for each character “journey” “line” “day” “hour” “one” “month” “ten” “day”. As can be seen by comparing FIG. 8B and FIG. 12C, in order to restore the document shown in FIG. 6, in the case of the information code format used in the first embodiment, FIG. As shown in b), 96-bit data is required, whereas in the second embodiment, since the document can be restored with a 64-bit information code, the information code can be compressed. I can confirm that I can do it.
[0094]
FIG. 13 shows an example of bitmap data after information code synthesis. This bitmap data is created by sequentially adding the information code shown in FIG. 12C to the information compositible pixels shown in FIG.
[0095]
On the other hand, in the information code conversion means 86 of the
[0096]
As described above, in the second embodiment, since the information code is compressed and added to the carrier font character, the number of information codes to be added to the carrier font character in order to restore the same amount of information is Compared with the first embodiment, the size can be reduced. In other words, the amount of information that can be restored increases compared to the case of the first embodiment. As a result, in addition to font, size, and style information, various information such as underline designation and double-angle designation can be added and restored as attribute information.
[0097]
In each of the embodiments described above, the image output means 40 is built in the
[0098]
In each of the above embodiments, the text document is described as an example. However, for example, a document including ruled lines includes “—”, “|”, “┌”, and ““ ”that configure ruled lines. , “┘”, “└”, “├”, “┤”, “┴”, “┬”, “┼” are regularized in the same way as in the case of characters, and incorporated into carrier font characters, By adding a ruled line thickness or a broken line style to the attribute information, the present invention can be used for a document including ruled lines as well as a character document.
[0099]
The carrier font character need not be one type. The character information may include a plurality of carrier font characters corresponding to each font including not only the character code and character position but also the font and size. In this way, the bitmap data created by this apparatus more accurately reflects the original document document. What character information is used as attribute information may be determined by the balance between the degree of fidelity of the generated bitmap data to the original and the capacity of the carrier font character font storage means.
[0100]
In addition, in the document restoration device, in order to be able to support both the information code added to the carrier font character without being compressed and the compressed information code added to the carrier font character, It is preferable to add a flag indicating whether the information code is added in the form of. Since it is usually determined whether or not each document is compressed, this flag indicates the first bit b of the information code of the first character in one document.11It is sufficient to add only one before the.
[0101]
In each of the above embodiments, a conventional font character is used as a basic font character and a carrier font character is created. However, this basic font character may be any font character. Often, new font characters that appear in the future can be used. For example, special font characters proposed by the present applicant in Japanese Patent Application No. 2000-82156 can be used. In this case, it goes without saying that the portion related to the dedicated font character such as the character recognition means 80 is described in the above Japanese Patent Application No. 2000-82156.
[0102]
As described above, in the paper DIF system according to the above-described embodiment, the user confirms the content of the document including not only the characters but also the attributes only by looking at the printed
[0103]
Therefore, by using the present invention as a document management method, document information can be managed only by paper output, so that document contents can be easily confirmed and searched, and digital data in the document is erroneous. It is possible to establish a document management method that can be restored without any problems and that does not cause the problem of double management.
[Brief description of the drawings]
FIG. 1 is a block diagram showing the configuration of an apparatus for creating a bitmap of carrier font characters
FIG. 2 is a flowchart showing a method for creating a carrier font character.
FIG. 3 is a diagram showing a method for creating a carrier font character from a basic font character, and shows a diagram (a) showing an example of bitmap data of the basic font character, and a diagram showing together information synthesizable pixels (FIG. b) A diagram (c) showing an example of bitmap data after the information code is synthesized
FIG. 4 is a block diagram showing a schematic configuration of a document creation apparatus according to the first embodiment of the present invention.
FIG. 5 is a block diagram showing a schematic configuration of the document restoration apparatus according to the first embodiment of the present invention.
FIG. 6 is a diagram showing an example of a document document
FIG. 7 is a diagram showing an example of the correspondence between attribute information and information code
FIG. 8 is a diagram showing an example of an information code format in the first embodiment;
9 is an enlarged view showing the correspondence between each information compositible pixel indicated by / in FIG. 3B and each bit of the information code of each character shown in FIG. 8B.
FIG. 10 is a view showing an example of a document in which an information code is added to a carrier font character.
FIG. 11 is a block diagram showing a schematic configuration of a document creation apparatus according to a second embodiment of the present invention.
FIGS. 12A and 12B show an example of an information code format according to the second embodiment, and FIG. 12C shows an example of data indicating a compressed information code.
FIG. 13 is a diagram showing an example of bitmap data after combining information codes
[Explanation of symbols]
1 Bitmap font creation device
2 Document creation device
3 Document restoration device
10 Basic font character storage means
11 Carrier font character creation means
20 Character / attribute information extraction means
30 Document data creation section
31 Carrier font character storage means
32 Bitmap data creation means
33 Information synthesizable pixel extraction means
34 Attribute information conversion table
35 Attribute information conversion means
36 Information code synthesis means
40 Image output means
50 printed matter
60 Image input means
70 Document bitmap data extraction means
80 character recognition means
85 Information code conversion table
86 Information code conversion means
87 Character / attribute information reconstruction means
88 character data restoration part
Claims (18)
前記文書原稿データを構成する各文字の情報から文字情報と属性情報を抽出し、
該抽出した各文字の文字情報に応じて、基礎フォント文字に変形を加えたキャリアフォント文字のビットマップを使用して前記文書原稿データに対応するビットマップデータを作成し、
前記抽出した各文字の属性情報を、該属性情報と該属性情報を表わす情報コードとの対応を表す第1の変換テーブルに基づいて前記情報コードに変換し、前記作成されたビットマップデータの各画素のうち所定の条件に合致した画素を、前記情報コードを合成することができる合成可能画素として抽出し、
前記情報コードを前記合成可能画素に順次付加することを特徴とする文書データ作成方法。A document data creation method for creating bitmap data of a document based on document manuscript data created by a computer,
Character information and attribute information are extracted from information of each character constituting the document manuscript data;
In accordance with the character information of each extracted character, a bitmap data corresponding to the document manuscript data is created using a bitmap of a carrier font character obtained by modifying a basic font character ,
The attribute information of each character that the extracted and converted into the information code based on a first conversion table showing the correspondence between the information codes representing the attribute information and the attribute information, each of the bit map data created in the above A pixel that matches a predetermined condition among the pixels is extracted as a synthesizeable pixel that can synthesize the information code,
A document data creation method, wherein the information code is sequentially added to the compositable pixels.
前記合成可能画素が、前記走査方向のライン上に並ぶ黒画素群に隣接する白画素であり、かつ、該白画素を黒画素に変えても2つの黒画素群がつながらない白画素であることを特徴とする請求項 The synthesizable pixel is a white pixel adjacent to a black pixel group arranged on the line in the scanning direction, and the white pixel is not connected to the two black pixel groups even if the white pixel is changed to a black pixel. Characteristic claims 11 記載の文書データ作成方法。Document data creation method described.
前記文書原稿データを構成する各文字の情報から文字情報と属性情報を抽出し、
該抽出した各文字の文字情報に応じて、基礎フォント文字に変形を加えたキャリアフォント文字のビットマップを使用して前記文書原稿データに対応するビットマップデータを作成し、
前記抽出した各文字の属性情報を、該属性情報と該属性情報を表わす情報コードとの対応を表す第1の変換テーブルに基づいて前記情報コードに変換し、前記情報コードが、文字によって固有な固有情報と行単位または段落単位で同一である非固有情報とに分離されるものであり、前記文書原稿データを構成する文字のうち連なった文字の前記非固有情報を消去して、前記連なった文字の情報コードを圧縮して圧縮済情報コードを生成し、前記作成されたビットマップデータの各画素のうち所定の条件に合致した画素を、前記圧縮済情報コードを合成することができる合成可能画素として抽出し、
前記圧縮済情報コードを前記合成可能画素に順次付加することを特徴とする文書データ作成方法。A document data creation method for creating bitmap data of a document based on document manuscript data created by a computer,
Character information and attribute information are extracted from information of each character constituting the document manuscript data;
In accordance with the character information of each extracted character, a bitmap data corresponding to the document manuscript data is created using a bitmap of a carrier font character obtained by modifying a basic font character ,
The attribute information of each character that the extracted and converted into the information code based on a first conversion table showing the correspondence between the information codes representing the attribute information and the attribute information, wherein the information code is unique by the letter It is separated into unique information and non-unique information that is the same in line units or paragraph units, and the non-unique information of consecutive characters among the characters constituting the document manuscript data is deleted, and the continuous information A compressible information code is generated by compressing a character information code, and a pixel that matches a predetermined condition among the pixels of the created bitmap data can be synthesized. Extract as pixels,
A method of creating document data, wherein the compressed information code is sequentially added to the compositable pixels.
前記合成可能画素が、前記走査方向のライン上に並ぶ黒画素群に隣接する白画素であり、かつ、該白画素を黒画素に変えても2つの黒画素群がつながらない白画素であることを特徴とする請求項3記載の文書データ作成方法。 The synthesizable pixel is a white pixel adjacent to a black pixel group arranged on the line in the scanning direction, and the white pixel is not connected to the two black pixel groups even if the white pixel is changed to a black pixel. The document data creation method according to claim 3, wherein:
前記文書のビットマップ中の前記合成可能画素に付加された前記情報コードを抽出し、前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記抽出した情報コードを属性情報に変換し、
該抽出した情報コードを前記文書のビットマップから除去し、該情報コードが除去されたビットマップに基づいて文字情報を復元することを特徴とする文字データ復元方法。A method for restoring character data of a document from bitmap data of a document created using the document data creation method according to claim 1 ,
The information code added to the synthesizable pixel in the bitmap of the document is extracted, and the extracted information code is referred to as attribute information by referring to a second conversion table indicating correspondence between the information code and the attribute information. Converted to
Removing the information code the extracted from the bitmap of the document, character data restoring method which is characterized in that to restore the character information based on the bit map in which the information code is removed.
前記文書のビットマップから走査方向のライン上に並ぶ黒画素群のランレングスが偶数値であるか奇数値であるかに基づいて前記情報コードを抽出し、前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記抽出した情報コードを属性情報に The information code is extracted from the bit map of the document based on whether the run length of the black pixel group arranged on the line in the scanning direction is an even value or an odd value, and the correspondence between the information code and the attribute information is determined. The extracted information code is referred to as attribute information by referring to the second conversion table 変換し、Converted,
該抽出した情報コードを前記文書のビットマップから除去し、該情報コードが除去されたビットマップに基づいて文字情報を復元することを特徴とする文字データ復元方法。 A character data restoration method comprising: removing the extracted information code from the bitmap of the document; and restoring character information based on the bitmap from which the information code has been removed.
前記文書のビットマップ中の前記合成可能画素に付加された前記圧縮済情報コードを抽出し、該抽出した圧縮済情報コードを復元して圧縮前の前記情報コードを求め、前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記求めた情報コードを属性情報に変換し、
前記抽出した圧縮済情報コードを前記文書のビットマップから除去し、該圧縮済情報コードが除去されたビットマップに基づいて文字情報を復元することを特徴とする文字データ復元方法。A method for restoring character data of a document from a bitmap of the document created using the document data creation method according to claim 3 ,
Extracting the zipped information code attached to the synthesizable pixel in the bitmap of the document, to restore the compressed completion information code the extracted obtains the information code before compression, the information code and the attribute Converting the obtained information code into attribute information with reference to a second conversion table representing correspondence of information;
Character data restoring method which is characterized in that the extraction Compressed information code removed from the bitmap of the document, to restore the character information based on the bit map in which the compressed completion information code has been removed.
前記文書のビットマップから走査方向のライン上に並ぶ黒画素群のランレングスが偶数値であるか奇数値であるかに基づいて前記圧縮済情報コードを抽出し、該抽出した圧縮済情報コードを復元して圧縮前の前記情報コードを求め、前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記求めた情報コードを属性情報に変換し、 The compressed information code is extracted from the bitmap of the document based on whether the run length of the black pixel group arranged on the line in the scanning direction is an even value or an odd value, and the extracted compressed information code is Reconstructing the information code before compression, converting the obtained information code into attribute information with reference to a second conversion table representing a correspondence between the information code and the attribute information,
前記抽出した圧縮済情報コードを前記文書のビットマップから除去し、該圧縮済情報コードが除去されたビットマップに基づいて文字情報を復元することを特徴とする文字データ復元方法。 A character data restoration method, wherein the extracted compressed information code is removed from the bitmap of the document, and character information is restored based on the bitmap from which the compressed information code is removed.
基礎フォント文字に変形を加えたキャリアフォント文字のビットマップデータを記憶するキャリアフォント文字記憶手段と、
前記文書原稿データを構成する各文字の情報から文字情報と属性情報を抽出する文字・属性情報抽出手段と、
該抽出した各文字の文字情報に応じて、前記キャリアフォント文字記憶手段からキャリアフォント文字のビットマップを読み出して前記文書原稿データに対応するビットマップデータを作成するビットマップデータ作成手段と、
前記抽出した各文字の属性情報を、該属性情報と該属性情報を表わす情報コードとの対応を表す第1の変換テーブルに基づいて前記情報コードに変換する属性情報変換手段と、
前記作成されたビットマップデータの各画素のうち所定の条件に合致した画素を、前記情報コードを合成することができる合成可能画素として抽出する情報合成可能画素抽出手段と、
前記情報コードを前記合成可能画素に順次付加する情報コード合成手段とを備えたことを特徴とする文書データ作成装置。A document data creation device that creates bitmap data of a document based on document original data created by a computer,
Carrier font character storage means for storing bitmap data of carrier font characters obtained by modifying basic font characters ;
Character / attribute information extracting means for extracting character information and attribute information from information of each character constituting the document manuscript data;
In accordance with the character information of each extracted character, bitmap data creation means for creating a bitmap data corresponding to the document document data by reading a bitmap of the carrier font characters from the carrier font character storage means;
The attribute information of each character that the extracted, the attribute information converting means for converting the information code based on a first conversion table showing the correspondence between the information codes representing the attribute information and the attribute information,
Information synthesizable pixel extracting means for extracting pixels that match a predetermined condition among the pixels of the created bitmap data as synthesizable pixels capable of synthesizing the information code;
An information code synthesizing unit for sequentially adding the information code to the synthesizable pixels.
前記合成可能画素が、前記走査方向のライン上に並ぶ黒画素群に隣接する白画素であり、かつ、該白画素を黒画素に変えても2つの黒画素群がつながらない白画素であることを特徴とする請求項10記載の文書データ作成装置。 The synthesizable pixel is a white pixel adjacent to a black pixel group arranged on the line in the scanning direction, and the white pixel is not connected to the two black pixel groups even if the white pixel is changed to a black pixel. 11. The document data creation device according to claim 10, wherein
基礎フォント文字に変形を加えたキャリアフォント文字のビットマップデータを記憶するキャリアフォント文字記憶手段と、
前記文書原稿データを構成する各文字の情報から文字情報と属性情報を抽出する文字・属性情報抽出手段と、
該抽出した各文字の文字情報に応じて、前記キャリアフォント文字記憶手段からキャリアフォント文字のビットマップを読み出して前記文書原稿データに対応するビットマップデータを作成するビットマップデータ作成手段と、
前記抽出した各文字の属性情報を、該属性情報と該属性情報を表わす情報コードとの対応を表す第1の変換テーブルに基づいて前記情報コードに変換する属性情報変換手段と、
前記情報コードが、文字によって固有な固有情報と行単位または段落単位で同一である非固有情報とに分離されるものであり、前記文書原稿データを構成する文字のうち連なった文字の前記非固有情報を消去して、前記連なった文字の情報コードを圧縮して圧縮済情報コードを生成する情報コード圧縮手段と、
前記作成されたビットマップデータの各画素のうち所定の条件に合致した画素を、前記圧縮済情報コードを合成することができる合成可能画素として抽出する情報合成可能画素抽出手段と、
前記圧縮済情報コードを前記合成可能画素に順次付加する情報コード合成手段とを備えたことを特徴とする文書データ作成装置。A document data creation device that creates bitmap data of a document based on document original data created by a computer,
Carrier font character storage means for storing bitmap data of carrier font characters obtained by modifying basic font characters ;
Character / attribute information extracting means for extracting character information and attribute information from information of each character constituting the document manuscript data;
In accordance with the character information of each extracted character, bitmap data creation means for creating a bitmap data corresponding to the document document data by reading a bitmap of the carrier font characters from the carrier font character storage means;
The attribute information of each character that the extracted, the attribute information converting means for converting the information code based on a first conversion table showing the correspondence between the information codes representing the attribute information and the attribute information,
The information code is separated into unique information unique to each character and non-unique information that is the same in line units or paragraph units, and the non-unique characters of consecutive characters that constitute the document manuscript data. Information code compression means for erasing information and compressing the information code of the consecutive characters to generate a compressed information code;
Information synthesizable pixel extracting means for extracting pixels that match a predetermined condition among the pixels of the created bitmap data as synthesizable pixels capable of synthesizing the compressed information code;
An apparatus for creating document data, comprising: information code synthesizing means for sequentially adding the compressed information code to the synthesizable pixels.
前記合成可能画素が、前記走査方向のライン上に並ぶ黒画素群に隣接する白画素であり、かつ、該白画素を黒画素に変えても2つの黒画素群がつながらない白画素であることを特徴とする請求項12記載の文書データ作成装置。 The synthesizable pixel is a white pixel adjacent to a black pixel group arranged on the line in the scanning direction, and the white pixel is not connected to the two black pixel groups even if the white pixel is changed to a black pixel. The document data creation device according to claim 12, characterized in that:
前記文書のビットマップ中の前記合成可能画素に付加された前記情報コードを抽出する情報コード抽出手段と、
前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記抽出した情報コードを属性情報に変換する情報コード変換手段と、
前記抽出した情報コードを前記文書のビットマップから除去する情報コード除去手段と、
該情報コードが除去されたビットマップに基づいて文字情報を復元する文字認識手段とを備えたことを特徴とする文字データ復元装置。A character data restoration device for restoring character data of a document from a bitmap of the document created by the document data creation device according to claim 10 ,
Information code extracting means for extracting the information code added to the compositable pixels in the bitmap of the document;
Information code conversion means for converting the extracted information code into attribute information with reference to a second conversion table representing the correspondence between the information code and the attribute information;
Information code removing means for removing the extracted information code from the bitmap of the document;
Character data restoration device which is characterized in that a character recognition means for restoring the character information based on the bit map in which the information code is removed.
前記文書のビットマップから走査方向のライン上に並ぶ黒画素群のランレングスが偶数値であるか奇数値であるかに基づいて前記情報コードを抽出する情報コード抽出手段と、 Information code extracting means for extracting the information code based on whether the run length of the black pixel group arranged on a line in the scanning direction is an even value or an odd value from the bitmap of the document;
前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記抽出した情報コードを属性情報に変換する情報コード変換手段と、 Information code conversion means for converting the extracted information code into attribute information with reference to a second conversion table representing the correspondence between the information code and the attribute information;
前記抽出した情報コードを前記文書のビットマップから除去する情報コード除去手段と、 Information code removing means for removing the extracted information code from the bitmap of the document;
該情報コードが除去されたビットマップに基づいて文字情報を復元する文字認識手段とを備えたことを特徴とする文字データ復元装置。 A character data restoration device comprising character recognition means for restoring character information based on a bitmap from which the information code has been removed.
前記文書のビットマップ中の前記合成可能画素に付加された前記圧縮済情報コードを抽出する情報コード抽出手段と、
該抽出した圧縮済情報コードを復元して圧縮前の前記情報コードを求める情報コード復元手段と、
前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記復元した情報コードを前記属性情報に変換する情報コード変換手段と、
前記抽出した圧縮済情報コードを前記文書のビットマップから除去する情報コード除去手段と、
該圧縮済情報コードが除去されたビットマップに基づいて文字情報を復元する文字認識手段とを備えたことを特徴とする文字データ復元装置。A character data restoration device for restoring character data of a document from a bitmap of the document created by the document data creation device according to claim 12 ,
Information code extracting means for extracting the compressed information code added to the compositable pixels in the bitmap of the document;
An information code reconstruction means for obtaining the information code before compression to restore the compressed completion information code the extracted,
An information code converting means for converting the second information code the restored by referring to the conversion table indicating the correspondence of the information codes and the attribute information in the attribute information,
Information code removing means for removing the extracted compressed information code from the bitmap of the document;
Character data restoration device which is characterized in that a character recognition means for restoring the character information based on the bit map in which the compressed completion information code has been removed.
前記文書のビットマップから走査方向のライン上に並ぶ黒画素群のランレングスが偶数値であるか奇数値であるかに基づいて前記圧縮済情報コードを抽出する情報コード抽出手段と、 Information code extracting means for extracting the compressed information code based on whether the run length of the black pixel group arranged on a line in the scanning direction is an even value or an odd value from the bitmap of the document;
該抽出した圧縮済情報コードを復元して圧縮前の前記情報コードを求める情報コード復元手段と、 Information code restoring means for restoring the extracted compressed information code and obtaining the information code before compression;
前記情報コードと前記属性情報の対応を表す第2の変換テーブルを参照して前記復元した情報コードを前記属性情報に変換する情報コード変換手段と、 Information code conversion means for converting the restored information code into the attribute information with reference to a second conversion table representing the correspondence between the information code and the attribute information;
前記抽出した圧縮済情報コードを前記文書のビットマップから除去する情報コード除去手段と、 Information code removing means for removing the extracted compressed information code from the bitmap of the document;
該圧縮済情報コードが除去されたビットマップに基づいて文字情報を復元する文字認識手段とを備えたことを特徴とする文字データ復元装置。 A character data restoration device comprising: character recognition means for restoring character information based on a bitmap from which the compressed information code has been removed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000084848A JP3731800B2 (en) | 2000-03-24 | 2000-03-24 | Document data creation method and apparatus, and character data restoration method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000084848A JP3731800B2 (en) | 2000-03-24 | 2000-03-24 | Document data creation method and apparatus, and character data restoration method and apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001274976A JP2001274976A (en) | 2001-10-05 |
JP3731800B2 true JP3731800B2 (en) | 2006-01-05 |
Family
ID=18601269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000084848A Expired - Fee Related JP3731800B2 (en) | 2000-03-24 | 2000-03-24 | Document data creation method and apparatus, and character data restoration method and apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3731800B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008193580A (en) * | 2007-02-07 | 2008-08-21 | Ricoh Co Ltd | Information processing apparatus |
JP2015158865A (en) * | 2014-02-25 | 2015-09-03 | 株式会社リコー | Document generation device, searchable file generation device, and document generation device |
-
2000
- 2000-03-24 JP JP2000084848A patent/JP3731800B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001274976A (en) | 2001-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW399179B (en) | Method and apparatus for compressing slice-oriented bitmaps | |
JP4854491B2 (en) | Image processing apparatus and control method thereof | |
EP0783160A2 (en) | A clock free two-dimensional barcode and method for printing and reading the same | |
US7481374B2 (en) | System and method for placement and retrieval of embedded information within a document | |
CN103186911B (en) | Method and device for processing scanned book data | |
US7965293B2 (en) | Image processing device, image processing method, and image processing program for reconstructing data | |
US7085423B2 (en) | Apparatus and method for filing and reproducing images | |
US7453594B2 (en) | Document filing apparatus for storing information added to a document file | |
JP3731800B2 (en) | Document data creation method and apparatus, and character data restoration method and apparatus | |
JPH08129550A (en) | Image processor and method for image processing | |
JP3823005B2 (en) | Bitmap font creation device and document restoration device | |
JP2001052110A5 (en) | ||
JP4396710B2 (en) | Image processing apparatus, image processing apparatus control method, and image processing apparatus control program | |
US6728426B1 (en) | Compression of form images in gray-level | |
CN100511267C (en) | Graph and text image processing equipment and image processing method thereof | |
Kise et al. | Backgrounds as information carriers for printed documents | |
JPH07121734A (en) | Character image editing device | |
JP2004072558A (en) | Electronic whiteboard and method for outputting data of electronic whiteboard | |
WO2004084539A1 (en) | Fill-in document creation device and creation method, fill-in content extraction device and extraction method, fill-in document | |
US20050188301A1 (en) | Method for providing data for a sheet, in particular for creating a print, and sheet provided thereby | |
JP4618609B2 (en) | How to book with personal handwriting | |
US5655027A (en) | Continuous extraction and processing of document fields | |
JP3847509B2 (en) | Address printing apparatus, address printing method, and recording medium recording address printing program | |
US20120250078A1 (en) | Image processing apparatus, image processing method and non-transitory computer readable medium storing program | |
JP2601253B2 (en) | Image processing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040817 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041015 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050524 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050722 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050913 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051006 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091021 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101021 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111021 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |