JP2001274976A - 文書データ作成方法および装置並びに文字データ復元方法および装置 - Google Patents

文書データ作成方法および装置並びに文字データ復元方法および装置

Info

Publication number
JP2001274976A
JP2001274976A JP2000084848A JP2000084848A JP2001274976A JP 2001274976 A JP2001274976 A JP 2001274976A JP 2000084848 A JP2000084848 A JP 2000084848A JP 2000084848 A JP2000084848 A JP 2000084848A JP 2001274976 A JP2001274976 A JP 2001274976A
Authority
JP
Japan
Prior art keywords
character
information
document
data
information code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000084848A
Other languages
English (en)
Other versions
JP3731800B2 (ja
Inventor
Tsutomu Kurose
勉 黒瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Riso Kagaku Corp
Original Assignee
Riso Kagaku Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Riso Kagaku Corp filed Critical Riso Kagaku Corp
Priority to JP2000084848A priority Critical patent/JP3731800B2/ja
Publication of JP2001274976A publication Critical patent/JP2001274976A/ja
Application granted granted Critical
Publication of JP3731800B2 publication Critical patent/JP3731800B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 文書データの作成方法において、元データの
レイアウトを崩すことなく、属性情報を付加できるよう
にする。 【解決手段】 黒画素群のランレングス(主走査方向)
が奇数であるキャリアフォント文字を用意する(図
a)。属性情報を所定のテーブルにしたがって情報コー
ドに変換し、この情報コードを、キャリアフォント文字
のビットマップにおける情報合成可能画素(図b)に、
情報コード「1」が黒画素となるように割り当てる(図
c)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、パーソナルコンピ
ュータやワードプロセッサなどで作成された文書のビッ
トマップデータを作成する方法および装置、並びにビッ
トマップから文字データを復元する方法および装置に関
するものである。
【0002】
【従来の技術】従来、ユーザがパーソナルコンピュータ
(以下パソコンという)やワードプロセッサ(以下ワー
プロという)で任意に作成した文書のデジタルデータ
(各文字の文字コードおよび印字位置の情報)を保管し
ておいたり、持ち運んだりすることができる記録媒体
(記憶媒体)として、フロッピー(登録商標)ディスク
やCD−ROMなどが広く知られている。この種の記録
媒体に記録されている文書の内容は、記録媒体に対応す
る装置、例えばFDドライブ装置やCD−ROMドライ
ブ装置などの読出装置を搭載したパソコンやワープロを
用いることで誤りなく復元させることができる。
【0003】ただし、保管状態にある多数の記録媒体の
中から、所望の文書を記録した媒体を見つけ出す(いわ
ゆる検索)ためには、パソコンやワープロを用いて、記
録されている文書をファイル名を頼りに順次読み出して
画面に表示して内容を確認する必要がある。しかしなが
ら、このような方法は、作業効率が悪いという問題点が
ある。
【0004】一方、持ち運び(ハンドリング)中の時間
を利用して文書の内容を確認するためには、記録媒体と
ともに表示部を有する携帯型の読出装置を持ち歩くか、
または該文書の印刷物(紙媒体)を持ち歩く必要があ
る。しかしながら、読出装置を持ち歩く方法では、見難
くない程度の表示画面を備えた装置にすると持ち運ぶの
に大きすぎたり重すぎたりするという問題があり、印刷
物を持ち歩く方法では、記録媒体と印刷物との両方を管
理(ファイル)する必要があり、二重管理が生じるとい
う問題点がある。
【0005】そこで、上述のような問題点を解決する一
方法として、文書を印刷物でのみハンドリングすること
とし、公知の種々の文字認識方法を用いて、印刷物の文
字を認識することで、文書のデジタルデータを復元する
ということが考えられる。
【0006】この際、例えば特開昭62−243087
号などに提案されているように、文字コードや文字位置
(以下文字情報という)だけでなく、アンダーライン、
倍角、フォント、サイズ、あるいはスタイルなどの文字
の属性を示す情報(以下属性情報という)とともに復元
するということも考えられる。
【0007】ここで、上記特開昭62−243087号
に提案されている方法とは、用紙上において、文書内容
を示す文字に加えて、例えば、倍角文字を指定する場合
はマル囲み付きBS、アンダーラインを指定する場合は
マル囲み付きUSなど前記属性情報を示す属性指定文字
を属性が変化する文字の直前に記入しておき、文字認識
の際に、前記属性指定文字を認識したときには、この属
性指定文字の情報に基づいてアンダーラインを付したり
倍角文字にするなど文書内容を示す文字を修飾するとい
うものである。
【0008】この方法を用いれば、パソコンなどで作成
した文書を紙出力のみで管理することができるようにな
るので、文書内容の確認や検索が容易にでき、また文書
のデジタルデータを文書内容だけでなく属性情報も含め
て復元でき、さらに、二重管理という問題を生じること
がない文書管理方法にすることができる。
【0009】
【発明が解決しようとする課題】しかしながら、上記特
開昭62−243087号に提案されている方法では、
属性が変化する文字の直前に属性指定文字を記入するの
で、元データの文字レイアウト(文字が配される位置)
と印刷物上の文字レイアウトとが一致しなくなるという
問題がある。このため、印刷物上の文字を見ただけで
は、元データや復元される文書のレイアウトの間違いや
バランスの悪さに気付くことができないという問題を招
くことにもなる。
【0010】本発明は上記事情に鑑みてなされたもので
あり、文書内容の確認や検索が容易にでき、また文書の
デジタルデータを文書内容だけでなく属性情報も含めて
復元でき、さらに、二重管理という問題を生じることが
ない文書管理方法を実現するに際して、文書の印刷物を
見ただけで、元データや該印刷物から復元される文書内
容およびレイアウトを確認することができる文字認識用
文書のビットマップデータを作成する方法および装置、
並びにビットマップから文字データを復元する方法およ
び装置を提供することを目的とするものである。
【0011】
【課題を解決するための手段】本発明による第1の文書
データ作成方法は、文書原稿に基づいて文書のビットマ
ップデータを作成する文書データ作成方法であって、前
記文書原稿を構成する各文字の情報から文字情報と属性
情報を抽出し、該抽出した各文字の文字情報に応じて、
所定の規則に基づいて作成されたキャリアフォント文字
のビットマップを使用して文書原稿に対応するビットマ
ップデータを作成し、前記抽出した各文字の属性情報を
第1の変換テーブルに基づいて所定の情報コードに変換
し、作成されたビットマップデータの各画素のうち所定
条件に合致した情報コードを合成することができる合成
可能画素を抽出し、情報コードを合成可能画素に順次付
加することを特徴とするものである。
【0012】本発明による第2の文書データ作成方法
は、第1の文書データ作成方法と同様に作成された文書
のビットマップデータに情報コードを付加(合成)する
に際して、情報コードを圧縮した後に付加するようにし
たものであって、文書原稿を構成する各文字の情報から
文字情報と属性情報を抽出し、該抽出した各文字の文字
情報に応じて、所定の規則に基づいて作成されたキャリ
アフォント文字のビットマップを使用して文書原稿に対
応するビットマップデータを作成し、抽出した各文字の
属性情報を第1の変換テーブルに基づいて所定の情報コ
ードに変換し、該情報コードを所定の条件に従って圧縮
して圧縮済情報コードを生成し、作成されたビットマッ
プデータの各画素のうち所定条件に合致した圧縮済情報
コードを合成することができる合成可能画素を抽出し、
圧縮済情報コードを合成可能画素に順次付加することを
特徴とするものである。
【0013】ここで「圧縮」は、各文字の情報コードを
それぞれ圧縮することに限らず、文書の全文字について
の全情報コードの量が少なくなるように、所定の文字に
ついての情報コードのみを圧縮するものであってもよ
い。
【0014】上記において「キャリアフォント文字」
は、該キャリアフォント文字のビットマップに情報コー
ドを付加したときに、後述する文字データ復元過程にお
いて、情報コードを付加したものであるのか否かを認識
するのに都合がよくなるようにした文字であって、文字
データ復元過程において情報コードを付加したものであ
るのか否かを認識することができる限り、どのようなも
のを使用してもよく、また、従来から使用されている文
字を変形して得たものであってもよい。
【0015】また「所定条件に合致した圧縮済情報コー
ドを合成することができる合成可能画素」は、後述する
文字データ復元過程において、情報コードを付加した画
素であるのか否かを認識するのに都合がよい画素であっ
て、文字データ復元過程において情報コードを付加した
ものであるのか否かを認識することができる限り、いず
れの画素を合成可能画素としてもよい。なお、情報コー
ドを付加することによって、元の文字の認識性を落とさ
ないように配慮するのが望ましい。
【0016】一方、本発明による第1の文字データ復元
方法は、上記第1の文書データ作成方法を使用して作成
された文書のビットマップデータから文書の文字データ
を復元する方法であって、文書のビットマップから各文
字の前記情報コードを抽出し、第2の変換テーブルを参
照して抽出した情報コードを属性情報に変換し、抽出し
た情報コードを文書のビットマップから除去し、該情報
コードが除去されたビットマップに基づいて文字認識を
行なって文字情報を復元することを特徴とするものであ
る。
【0017】また、本発明による第2の文字データ復元
方法は、上記第2の文書データ作成方法を使用して作成
された文書のビットマップから文書の文字データを復元
する方法であって、文書のビットマップから各文字の前
記圧縮済情報コードを抽出し、抽出した圧縮済情報コー
ドを復元して圧縮前の情報コードを求め、第2の変換テ
ーブルを参照して求めた情報コードを属性情報に変換
し、抽出した圧縮済情報コードを文書のビットマップか
ら除去し、該圧縮済情報コードが除去されたビットマッ
プに基づいて文字認識を行なって文字情報を復元するこ
とを特徴とするものである。
【0018】上記第1および第2の文字データ復元方法
においては、復元した文字情報に対して、変換された属
性情報に基づいて修飾を施すことが望ましい。
【0019】本発明による第1の文書データ作成装置
は、上記第1の文書データ作成方法を実施する装置、す
なわち、文書原稿に基づいて文書のビットマップデータ
を作成する文書データ作成装置であって、所定の規則に
基づいて作成されたキャリアフォント文字のビットマッ
プデータを記憶するキャリアフォント文字記憶手段と、
文書原稿を構成する各文字の情報から文字情報と属性情
報を抽出する文字・属性情報抽出手段と、該抽出した各
文字の文字情報に応じて、キャリアフォント文字記憶手
段からキャリアフォント文字のビットマップを読み出し
て文書原稿に対応するビットマップデータを作成するビ
ットマップデータ作成手段と、抽出した各文字の属性情
報を第1の変換テーブルに基づいて所定の情報コードに
変換する属性情報変換手段と、作成されたビットマップ
データの各画素のうち所定条件に合致した情報コードを
合成することができる合成可能画素を抽出する情報合成
可能画素抽出手段と、情報コードを合成可能画素に順次
付加する情報コード合成手段とを備えたことを特徴とす
るものである。
【0020】本発明による第2の文書データ作成装置
は、上記第2の文書データ作成方法を実施する装置、す
なわち、文書原稿に基づいて文書のビットマップデータ
を作成する文書データ作成装置であって、所定の規則に
基づいて作成されたキャリアフォント文字のビットマッ
プデータを記憶するキャリアフォント文字記憶手段と、
文書原稿を構成する各文字の情報から文字情報と属性情
報を抽出する文字・属性情報抽出手段と、該抽出した各
文字の文字情報に応じて、キャリアフォント文字記憶手
段からキャリアフォント文字のビットマップを読み出し
て文書原稿に対応するビットマップデータを作成するビ
ットマップデータ作成手段と、抽出した各文字の属性情
報を第1の変換テーブルに基づいて所定の情報コードに
変換する属性情報変換手段と、該変換された情報コード
を所定の条件に従って圧縮して圧縮済情報コードを生成
する情報コード圧縮手段と、作成されたビットマップデ
ータの各画素のうち所定条件に合致した圧縮済情報コー
ドを合成することができる合成可能画素を抽出する情報
合成可能画素抽出手段と、圧縮済情報コードを合成可能
画素に順次付加する情報コード合成手段とを備えたこと
を特徴とするものである。
【0021】また、本発明による第1の文字データ復元
装置は、上記第1の文字データ復元方法を実施する装
置、すなわち、上記第1の文書データ作成装置により作
成された文書のビットマップから文書の文字データを復
元する文字データ復元装置であって、文書のビットマッ
プから各文字の情報コードを抽出する情報コード抽出手
段と、第2の変換テーブルを参照して抽出した情報コー
ドを属性情報に変換する情報コード変換手段と、抽出し
た情報コードを文書のビットマップから除去する情報コ
ード除去手段と、該情報コードが除去されたビットマッ
プに基づいて文字認識を行なって文字情報を復元する文
字認識手段とを備えたことを特徴とするものである。
【0022】本発明による第2の文字データ復元装置
は、上記第2の文字データ復元方法を実施する装置、す
なわち、上記第2の文書データ作成装置により作成され
た文書のビットマップから文書の文字データを復元する
文字データ復元装置であって、文書のビットマップから
各文字の圧縮済情報コードを抽出する情報コード抽出手
段と、抽出した圧縮済情報コードを復元して圧縮前の情
報コードを求める情報コード復元手段と、第2の変換テ
ーブルを参照して復元した情報コードを属性情報に変換
する情報コード変換手段と、抽出した圧縮済情報コード
を文書のビットマップから除去する情報コード除去手段
と、該圧縮済情報コードが除去されたビットマップに基
づいて文字認識を行なって文字情報を復元する文字認識
手段とを備えたことを特徴とするものである。
【0023】本発明による第1および第2の文字データ
復元装置においては、復元した文字情報に対して、変換
された属性情報に基づいて修飾を施す修飾手段を更に備
えたものとするのが望ましい。
【0024】
【発明の効果】本発明による第1の文書データ作成方法
および装置、並びに第1の文字データ復元方法および装
置(以下纏めて第1の発明という)によれば、文書デー
タ作成過程において、文書原稿を構成する各文字の情報
から文字情報と属性情報を抽出し、抽出した文字情報に
応じて作成された文書原稿に対応するビットマップデー
タに抽出した属性情報を表す情報コードを付加し、文字
データ復元過程において、文書のビットマップから各文
字の情報コードを抽出して、変換テーブルを参照して情
報コードを属性情報に変換する一方、情報コードを除去
した後のビットマップに基づいて文字認識を行なって文
字情報を復元するようにしたので、元の文書のデジタル
データを属性情報も含めて正確に復元させることができ
る。
【0025】このように、第1の発明によれば、文書の
デジタルデータを文書内容だけでなく属性情報も含めて
復元することができるようにしているので、結果とし
て、パソコンなどで作成した文書を紙出力のみで管理す
ることができるようになるので、二重管理という問題を
生じることがない文書管理方法にすることができる。
【0026】また、第1の文書データ作成方法および装
置における文書データ作成過程においては、文字の属性
情報を属性指定文字の記入ではなく、キャリアフォント
文字のビットマップに情報コードとして付加しているの
で、元データのレイアウトを崩すことなく属性情報を付
加することができ、パソコンなどで作成した文書の元デ
ータと略同じ位置に各文字が出力され、元データの文字
レイアウトと印刷物上の文字レイアウトとが一致しなく
なるという問題が生じることがなく、文書の印刷物を見
ただけで、元データや該印刷物から復元される文書内容
およびレイアウトを確認することができる。
【0027】また、本発明による第2の文書データ作成
方法および装置、並びに第2の文字データ復元方法およ
び装置(以下纏めて第2の発明という)によれば、文書
データ作成過程において、情報コードを圧縮した後に第
1の発明と同様の方法により圧縮済情報コードを付加
し、文字データ復元過程において、文書のビットマップ
から抽出した圧縮済情報コードを元の情報コードに復元
して、第1の発明と同様の方法により、属性情報や文字
情報を得るようにしたので、同一の情報量を復元するた
めの情報コード数を、情報コードを圧縮しない場合に比
べて縮小でき、復元できる属性情報量が第1の発明より
も増加するという効果がある。
【0028】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について詳細に説明する。
【0029】図1は後述する本発明の実施の形態による
文書データ作成方法および文字データ復元方法を実施す
る各装置に使用されるキャリアフォント文字のビットマ
ップを作成する装置の構成を示すブロック図である。
【0030】図1に示すように、このビットマップフォ
ント作成装置1は、基礎ビットマップフォントを構成す
る基礎フォント文字のビットマップデータを記憶する基
礎フォント文字記憶手段10と、読み出したビットマッ
プデータが表す基礎フォント文字のビットマップに対し
て、後述する方法を用いて変形を加えることにより、水
平方向1ラインごとの黒画素群の構成画素数(以下ラン
レングスという)を奇数値にすることにより、新たなフ
ォント文字(以下キャリアフォント文字という)を作成
するキャリアフォント文字作成手段11とを備えてい
る。
【0031】このランレングスが奇数値にされたキャリ
アフォント文字は、従来のフォント文字自体の各ランレ
ングスが全て奇数値である場合もあるが、そうでないと
きには、従来のフォント文字を基礎フォント文字として
ビットマップ化した後に、後述する方法を用いて微小変
形を加えることで作成することができる。ここで、ラン
レングスを奇数化しているのは、文字の属性情報を二値
データとして文字のビットマップに付加(合成)し、付
加した二値データを復元(分離)できるようにするため
である(詳細は後述する)。
【0032】次に、ビットマップフォント作成装置1に
よるビットマップフォントの作成方法、つまりビットマ
ップフォントを構成する多数のキャリアフォント文字を
作成する方法について、図2に示すフローチャートを参
照して説明する。なお、図2中、ステップ番号にはS印
を付す。
【0033】1)キャリアフォント文字作成手段11
は、先ず、基礎フォント文字記憶手段10に格納されて
いる、キャリアフォント文字の基礎となる特定のフォン
ト文字(基礎フォント文字)、サイズ、およびスタイル
を有する一般的な文字である基礎フォント文字のセット
(フォントデータ)から、任意の1文字のデータを選択
して読み出す。そして、読み出した基礎フォント文字の
文字サイズに応じて固有な領域内で水平方向1ラインご
とに走査を行ない(ステップ1)、黒画素を検出する
(ステップ2)。さらに、検出された黒画素を先頭とす
る黒画素群のランレングスを計数する(ステップ3)。
【0034】ここで、固有な領域としては、図6の文字
の周囲に点線を付した矩形領域とするとよい。また、走
査とは、画像データ上でのことを意味し、例えば基礎フ
ォント文字の画素データをエリアメモリにそのビットマ
ップに対応させて格納し、このメモリ上において走査す
るとよい。
【0035】ステップ3において計数された黒画素群の
ランレングスが、奇数であるか否かを判定し(ステップ
4)、奇数でないと判定された場合には、黒画素群を構
成する走査方向最前段の画素を白画素に変換して、ラン
レングスを奇数化する(ステップ5)。
【0036】2)ステップ4においてランレングスが奇
数であると判定された場合およびステップ5においてラ
ンレングスを奇数化した後には、ステップ1からステッ
プ4あるいはステップ5までの処理を、上記文字サイズ
に応じて固有な領域内の全ラインの走査が終了するまで
繰り返し行なう。
【0037】そして、以上の処理を、全ての基礎フォン
ト文字に対して行なうことで、キャリアフォント文字の
フォントデータが作成される。作成されたフォントデー
タは、例えばCD−ROMなどのコンピュータ読取り可
能な媒体に記録して配布するとよい。図3(a)に漢字
「旅」および「行」についての各キャリアフォント文字
のビットマップデータの一例を示す。
【0038】このように、上記方法を用いれば、簡単な
方法でキャリアフォント文字のビットマップデータを作
成することができる。
【0039】次に、上述のようにして作成されたキャリ
アフォント文字からなるビットマップフォントを用いて
文書のビットマップデータを作成する、本発明に係る文
書データ作成部を備えた文書作成装置、および文書作成
装置により作成、出力された印刷物から文書の文字デー
タを復元する、本発明に係る文書データ復元部を備えた
文書復元装置の第1の実施の形態について説明する。な
お、この文書作成装置と文書復元装置とを合わせて、紙
によるデジタル・インターフェース・システム(以下紙
DIFシステムという)という。
【0040】図4は文書作成装置の概略構成を示すブロ
ック図、図5は文書復元装置の概略構成を示すブロック
図、図6はパソコンやワープロなどで作成された文書原
稿の一例を示す図である。
【0041】文書作成装置2は、図4に示すように、文
字・属性情報抽出手段20と、キャリアフォント文字記
憶手段31、文書ビットマップデータ作成手段32、情
報合成可能画素抽出手段33、本発明の第1の変換テー
ブルとしての属性情報変換テーブル34、属性情報変換
手段35、および情報コード合成手段36からなる文書
データ作成部30と、プリンタなどの画像出力手段40
とから構成されており、ユーザがパソコンやワープロで
任意に作成した文書の文字および属性情報に応じて、キ
ャリアフォント文字を用いた文字認識用文書としての情
報コード合成文書の印刷物50を作成し、出力するもの
である。
【0042】文書データ作成部30を構成するキャリア
フォント文字記憶手段31には、上述したビットマップ
フォント作成装置1により作成されたキャリアフォント
文字を格納するものである。なお、フォントデータの入
手に際しては、例えば専用フォント文字のセットを記録
したCD−ROMなどの媒体を不図示の読取装置で読み
取って、読み取ったデータをキャリアフォント文字記憶
手段31に記憶させるとよい。
【0043】文書データ作成部30を構成する文書ビッ
トマップデータ作成手段32は、ユーザがパソコンやワ
ープロで任意に作成した文書の各文字の文字情報のうち
の文字コードに応じてキャリアフォント文字記憶手段3
1に記憶されている所定のキャリアフォント文字のビッ
トマップデータを読み出し、この読み出したキャリアフ
ォント文字のビットマップデータを、各文字の文字情報
のうち文字位置基準点の座標に応じて、元の文書の大き
さに対応する全画素が白のデジタル画像の所定の位置に
貼り付けることによって、キャリアフォント文字を用い
た文書のビットマップデータを作成するものである。
【0044】ここで、文字位置基準点の座標としては、
文字サイズに応じて固有な領域内の所定の座標とすれば
よく、本例においては、図6中●で示す、各文字の周囲
に点線を付した矩形領域a内の左上頂点画素の座標とす
る。なお、これに限らず、文字の基準位置を定めること
ができるかぎり、その他の座標を文字位置基準点の座標
としてもよい。
【0045】文書データ作成部30を構成する情報合成
可能画素抽出手段33は、キャリアフォント文字を用い
た文書の画像領域内での水平方向1ラインごとの走査に
よって、情報合成可能画素としての黒画素群を構成する
走査方向最前段の画素に隣接する白画素を抽出するもの
である。
【0046】文書データ作成部30を構成する属性情報
変換手段35は、フォント、サイズ、スタイルおよび文
字位置基準点座標修正データの各情報を、図7に示す属
性情報変換テーブル34に基づいて所定の情報コードに
それぞれ変換し、各情報コードを所定のフォーマットに
当てはめるものである。
【0047】文書データ作成部30を構成する情報コー
ド合成手段36は、所定のフォーマットに当てはめられ
た情報コードを、所定の順序にしたがって、情報合成可
能画素抽出手段33によって抽出された情報合成可能画
素に付加して、キャリアフォント文字を用いた情報コー
ド合成文書のビットマップデータを作成するものであ
る。
【0048】文書復元装置3は、図5に示すように、4
00dpiの解像度を有するスキャナなどの画像入力手
段60と、文書ビットマップデータ抽出手段70と、文
字認識手段80、情報コード分離手段84、本発明の第
2の変換テーブルとしての情報コード変換テーブル8
5、情報コード変換手段86および修飾手段としての文
字・属性情報再構成手段87からなる文字データ復元部
88とから構成されており、上記文書作成装置2により
作成、出力された印刷物50から、元の文書の文字デー
タをパソコンやワープロ上で復元させるものである。
【0049】文字データ復元部88を構成する情報コー
ド分離手段84は、文書ビットマップデータ抽出手段7
0により抽出された文字について、水平方向1ラインご
との走査によって全ての黒画素群を検出した後、各黒画
素群のランレングスを計数して情報コードを分離すると
共に、情報コード「1」を表す黒画素を白画素に修正し
ておくものである。すなわち、情報コード分離手段84
は、本発明の情報コード抽出手段と情報コード除去手段
とを兼ねるものである。
【0050】文字データ復元部88を構成する文字認識
手段80は、情報コード分離手段84により修正された
後の、キャリアフォント文字を用いた文書のビットマッ
プデータから、文字(本例においては文字コード)およ
び文字位置基準点の座標を復元するものである。文字認
識方法としては、公知の種々の方法を用いることができ
る。
【0051】文字データ復元部88を構成する情報コー
ド変換テーブル85には、上記文字作成装置2の属性情
報変換テーブル34に格納されている情報と同一のもの
が格納される。
【0052】文字データ復元部88を構成する情報コー
ド変換手段86は、情報コード分離手段84によって分
離された情報コードを、文字位置基準点の座標が小さい
順に1文字分ずつグループ化して、前記所定のフォーマ
ットに応じて当てはめ、情報コード変換テーブル85に
基づいて、フォント、サイズ、スタイル、文字位置基準
点座標修正データの4つの文字の属性情報に変換(復
元)するものである。
【0053】文字データ復元部88を構成する文字・属
性情報再構成手段87は、文字認識手段80により復元
された文字コードおよび文字位置基準点の座標と、情報
コード変換手段86によって文字位置基準点の座標が小
さい順に復元されたフォント、サイズ、スタイル、文字
位置基準点座標修正データの4つの文字の属性情報とを
対応付けるものである。
【0054】なお、文字・属性情報再構成手段87の後
段に画像出力手段を備え、元の文書を印刷物として復元
させるようにしてもよい。
【0055】次に、文書作成装置2および文書復元装置
3からなる紙DIFシステムの作用について説明する。
【0056】文書作成装置2では、以下のようにしてキ
ャリアフォント文字を用いて文書の印刷物50が出力さ
れる。
【0057】1)先ず文字・属性情報抽出手段20によ
り、ユーザがパソコンやワープロで任意に作成した文書
の各文字の文字コード、文字位置基準点の座標、フォン
ト、サイズ、スタイルの5つの属性情報を抽出する。
【0058】なお、文字・属性情報抽出手段20による
属性情報の抽出の際には、文書データの文字レイアウト
に合わせて抽出するようにする。具体的には、図6に示
す印刷物50に対応する文書データから属性情報を抽出
する場合には、印刷物50の左上を走査原点として、右
方向を主走査方向、下方向を副走査方向として抽出する
こととする。走査方向がこれとは異なる場合には、画像
データ上で適当な回転処理を行った後に抽出処理を行な
うようにする。なお、走査とは、画像データ上でのこと
を意味し、例えばパソコンなどで作成した文書の画素デ
ータをエリアメモリにそのビットマップに対応させて格
納し、このメモリ上において走査するとよい。
【0059】抽出した各文字の属性情報は、文字位置基
準点の座標が走査順で小さい文字から順次抽出するもの
とする。例えば、図6においては、「旅」「行」「日」
「時」「一」「月」「十」「日」の順で抽出する。
【0060】2)次に、文書ビットマップデータ作成手
段32において、各文字の文字コードに応じて、キャリ
アフォント文字フォント記憶手段31に記憶されている
所定のキャリアフォント文字のビットマップデータを順
次読み出す。そして、文書の各文字の文字位置基準点が
配される用紙上の位置に該文字に対応するキャリアフォ
ント文字の文字位置基準点が配されるように、元の文書
の大きさに対応する全画素が白のデジタル画像の所定の
位置に、読み出したキャリアフォント文字のビットマッ
プデータを順次貼り付ける。これにより、キャリアフォ
ント文字を用いた文書のビットマップデータD1が作成
される。
【0061】このようにして作成されたビットマップデ
ータD1は、キャリアフォント文字のビットマップを構
成する水平方向(文書の行方向に相当)1ラインごとの
黒画素群の構成画素数,すなわちランレングスが奇数値
とされたものとなっている。
【0062】また、この第1の実施の形態においては、
文書復元装置において400dpiの解像度を有する画
像入力手段60を使用するものとしているために、ユー
ザがパソコンやワープロで作成した400dpiのドッ
トの解像度を有する文書から、100dpiのドットの
解像度を有する印刷物50を作成するようにしている。
これは、印刷物50の画像データを文書ビットマップデ
ータ抽出手段70で正確に抽出するためには、画像入力
手段60の解像度が印刷物50のドットの解像度以上を
要するためである。よって、文書ビットマップデータ作
成手段32によるキャリアフォント文字のビットマップ
データの貼り付けは、図6中●で示す400dpi相当
の文字位置基準点の座標を変換することによって得られ
る100dpi相当の文字位置基準点の座標が、図3
(a)中○で示すキャリアフォント文字の文字サイズに
応じて固有な領域b内の左上頂点画素の座標と一致する
ように行われる。
【0063】なお、この第1の実施の形態においては、
400dpiから100dpiへの変換により生じるズ
レ量の情報(以下文字位置基準点座標修正データとい
う)を属性情報とともにキャリアフォント文字に付加し
ておくことで、文書復元装置3において文字位置基準点
の座標を正確に復元することができるようにしている。
【0064】これは、400dpiのフォント文字を1
00dpiで表現すると、解像度が1/4になり、文書
作成装置2により出力される文字レイアウトの位置精度
も1/4に低下するので、例えば、ある文字の原稿上の
座標(400dpi)が、主走査方向X=401、副走
査方向Y=403であったとき、文書作成装置2により
出力された用紙上での座標は、X=100(あまり
1)、Y=100(あまり3)になるなど、かっこ内の
「あまり」の部分を再現することができない。したがっ
て、文字位置基準点の座標を正確に復元するには、この
位置精度の低下分を補正する必要があり、本例において
は、文字位置基準点座標修正データとして、前記「あま
り」のX座標成分とY座標成分とを示す情報を属性情報
とともにキャリアフォント文字に付加しておき、復元の
過程において、X座標成分とY座標成分とを使用して、
この「あまり」の部分を修正することにしている。
【0065】3)次に、情報合成可能画素抽出手段33
により、キャリアフォント文字を用いた文書の画像領域
内での水平方向1ラインごとの走査によって、上記情報
合成可能画素としての黒画素群を構成する走査方向最前
段の画素に隣接する白画素を抽出する。ただし、この白
画素のうち、黒画素に変更することで2つの黒画素群が
つながって新しい1つの黒画素群が形成されてしまうも
のについては、情報コードを合成できない画素として扱
う。これは、情報コードを付加することによって、紙出
力において元の文字の認識性を落とさないようにするた
めである。図3(a)のキャリアフォント文字「旅」
「行」のビットマップに情報合成可能画素を合わせて示
した図を図3(b)に示す。図3(b)中、/が情報合
成可能画素を示し、×が2つの黒画素群がつながるため
情報コードを合成できない画素を示す。
【0066】4)さらに属性情報変換手段35により、
フォント、サイズ、スタイルおよび文字位置基準点座標
修正データの情報を、図7に示す属性情報変換テーブル
34に基づいて情報コードに変換した後、所定のフォー
マットに当てはめる。
【0067】具体的には、図8(a)に示すように、フ
ォントの情報をb11,b10,b の3ビット(b
it)分に、サイズの情報をb,b,b
3ビット分に、スタイルの情報をb,bの2ビ
ット分に、文字位置基準点座標修正データのうちのY座
標成分をb,bの2ビット分に、同じくX座標
成分をb,bの2ビット分に、それぞれ当ては
めて12ビットからなるコードデータとする。
【0068】各文字「旅」「行」「日」「時」「一」
「月」「十」「日」についての情報コードを示すデータ
の一例を図8(b)に示す。
【0069】5)さらに情報コード合成手段36によ
り、図8(a)に示すフォーマットに当てはめられた情
報コードを、b11,…,bの順で、情報合成可能
画素抽出手段33によって抽出された情報合成可能画素
に走査順にしたがって順次付加する。ここで「走査順」
とは、図6に示す文書原稿に対応するビットマップ上に
おいて、右方向を主走査方向X、下方向を副走査方向Y
とし、ラスタースキャンの走査と同じように、左上を走
査原点として、先ず主走査を行い、1ライン分の主走査
が終了したら次のラインにシフトするような順序であ
る。なお、1文字分の情報コードの付加が終了したら、
次の文字の情報コードを引き続き付加するようにする。
【0070】図3(b)中/で示す各情報合成可能画素
と図8(b)に示す各文字の情報コードの各ビットとの
対応関係を、図3(b)を拡大して図9に示す。図示す
るように、図9中の情報合成可能画素の走査順に、各文
字の情報コードの各ビットが順に対応するようになって
おり、「一」のビットb以降については、図示しな
い次の文字の情報合成可能画素と対応し、全ての文字の
情報コードが余すところなく対応づけられることとな
る。
【0071】なお、この第1の実施の形態においては、
情報コードとして「1」を付加する場合にのみ、情報合
成可能画素を黒画素に変更して、黒画素群のランレング
スが偶数に変化するようにしている。これにより、キャ
リアフォント文字を用いた情報コード合成文書のビット
マップデータが作成される。
【0072】情報コード合成後のキャリアフォント文字
を用いたビットマップデータの一例を図3(c)に示
す。このビットマップデータは、図3(b)中/で示す
情報合成可能画素に、図8(b)に示す情報コードを表
す画素を付加することにより作成されたものである。な
お、「一」のビットb以降については、図示しない
次の文字に付加され、全ての文字の情報コードが余すと
ころなく付加されることとなる。
【0073】6)最後に、画像出力手段40により、キ
ャリアフォント文字を用いた情報コード合成済文書のビ
ットマップデータD2に基づいて、該文書の印刷物50
を100dpiで出力する。これにより、パソコンなど
で作成した文書の元データと略同じレイアウト(文字位
置)でキャリアフォント文字が印刷される。
【0074】なお、この第1の実施の形態においては、
後述する文書復元装置3の文書ビットマップデータ抽出
手段70によって文書ビットマップデータを正確に抽出
することができるように、文書の画像領域サイズおよび
解像度に応じたスケール枠55を用紙の縁から数ミリ内
側にかけて印刷するようにしている。図10に、このス
ケール枠55付きの、キャリアフォント文字に情報コー
ドを付加した文書の印刷物50の一例を示す。なお、ス
ケール枠に限らず、その他の基準位置を示す文字や記号
を印刷するようにしてもよい。
【0075】図10から判るように、キャリアフォント
文字の一部(図では「旅」や「行」)については元の文
字(基礎フォント文字)に比べて、ランレングスを奇数
値にしたり情報コードを表す画素を付加するようにして
いるので、形状が多少変形されているが、文字の認識性
を損ねるものではなく、このような印刷物50を見ただ
けで、ユーザは元の文書の文字内容を容易に確認でき
る。
【0076】また、文字の属性情報を属性指定文字の記
入ではなく、キャリアフォント文字のビットマップに情
報コードとして付加しているので、パソコンなどで作成
した文書の元データと略同じ位置に各文字が出力され、
元データの文字レイアウトと印刷物上の文字レイアウト
とが一致しなくなるという問題が生じることがなく、文
書の印刷物を見ただけで、元データや該印刷物から復元
される文書内容およびレイアウトを確認することができ
る。
【0077】また、第1の文書データ作成方法および装
置における文書データ作成過程においては、文字の属性
情報を属性指定文字の記入ではなく、キャリアフォント
文字のビットマップに情報コードとして付加しているの
で、元データのレイアウトを崩すことなく属性情報を付
加することができ、パソコンなどで作成した文書の元デ
ータと略同じ位置に各文字が出力されるので、元データ
の文字レイアウトと印刷物上の文字レイアウトとが一致
しなくなるという問題が生じることがなく、文書の印刷
物を見ただけで、元データや該印刷物から復元される文
書内容およびレイアウトを確認することができる。
【0078】一方、文書復元装置3では、以下のように
してキャリアフォント文字を用いた文書の印刷物50か
ら元の文書のデジタルデータD1が復元される。
【0079】1)画像入力手段60により、キャリアフ
ォント文字を用いた情報コード合成済文書の印刷物50
を400dpiの多値画像データとして読み込む。ま
た、文書ビットマップデータ抽出手段70により、この
多値画像データから、該印刷物50のスケール枠55内
に存在する100dpiの文書ビットマップデータを抽
出する。
【0080】なお、画像入力手段60による印刷物50
の読み込みの際には、印刷物50の文字レイアウトに合
わせて読み込むようにする。具体的には、図6に示す印
刷物50を読み込む場合には、印刷物50の左上を走査
原点として、右方向を主走査方向、下方向を副走査方向
として読み取ることとする。読取り方向がこれとは異な
る場合には、画像データ上で適当な回転処理を行った後
に後述する各処理を行なうようにする。
【0081】なお、この第1の実施の形態においては、
上述のように印刷物50にはスケール枠55が印刷され
ている。スケール枠55と印刷文字との相対位置は原稿
画像を忠実に再現するものであり、印刷物が多少天地左
右にずれて画像入力手段60により斜めに読み取られて
も、周知の位置ズレ補正方法を用いてこの相対位置に基
づいて画像データ上で位置ズレを補正することにより、
位置ズレのない文書ビットマップデータを抽出すること
ができ、結果として正確な文字認識が可能となる。つま
り、スケール枠55は文書ビットマップデータを抽出す
る際の位置決め用のデータとして機能するものである。
【0082】2)情報コード分離手段84により、水平
方向1ラインごとの走査によって全ての黒画素群を検出
する。さらに、各黒画素群のランレングスを計数し、該
ランレングスが奇数である場合は情報として「0」、偶
数である場合は情報として「1」がそれぞれ付加されて
いると判断して情報コードを分離する。なお、この情報
コードは、文字位置基準点の座標が走査順で小さい文字
から順番に分離される。また、この情報コードの分離と
共に、ランレングスが偶数であった黒画素群を構成する
走査方向最前段の情報コード「1」を表す黒画素を白画
素に修正しておく。これにより情報コードを除去した後
のキャリアフォント文字を用いた文書のビットマップデ
ータが作成される。
【0083】3)文字認識手段80において、情報コー
ド分離手段84によって情報コードを除去した後のキャ
リアフォント文字を用いた文書のビットマップデータと
不図示の照合用テーブルとに基づいて、文字コードおよ
び100dpi相当の文字位置基準点の座標を復元す
る。
【0084】4)情報コード変換手段86により、情報
コード分離手段84によって分離された情報コードを、
1文字分ずつ、すなわち12ビットずつグループ化し
て、図8(a)に示すフォーマットにb11,…,b
の順で当てはめる。さらに、図7に示す情報コード
変換テーブル85に基づいて所定の属性情報に変換す
る。これにより、文字位置基準点の座標が走査順で小さ
いものから順に、フォント、サイズ、スタイル、および
文字位置基準点座標修正データの5つの属性情報を復元
する。
【0085】5)文字・属性情報再構成手段87におい
て、100dpi相当の文字位置基準点の座標が小さい
順に情報コード変換手段86によって復元されたフォン
ト、サイズ、スタイル、文字位置基準点座標修正データ
の情報とを対応付ける。具体的には、文字コードおよび
100dpi相当の文字位置基準点の座標を、該文字位
置基準点の座標の小さい順に並び替えて、フォント、サ
イズ、スタイルおよび文字位置基準点座標修正データと
対応付けて、フォント、サイズ、あるいはスタイルに応
じた文字のビットマップデータを配置する。また、10
0dpi相当の文字位置基準点の座標と文字位置基準点
座標修正データとから、400dpi相当の文字位置基
準点の座標を復元する、つまり元の文書データの文字と
同じ位置に文字のビットマップデータが配置されるよう
にする。
【0086】これにより、文字コードの記述からなる、
元の文書のデジタルデータを、パソコンやワープロ上で
属性情報も含めて正確に復元させることができる。つま
り、文字(本例では文字コード)の復元はキャリアフォ
ント文字に基づいて行なっており、少なくとも、従来の
文字認識技術と同じレベルの認識率で文書のデジタルデ
ータを正確に復元させることができるし、フォント、サ
イズ、あるいはスタイルなどの属性情報を失うこともな
い。また、文字の基準位置情報も含めて復元するように
しているので、文字が配されるべき位置についても正確
に復元することができ、復元されたデジタルデータに基
づいて再出力した画像上や印刷物上においても、元の文
書とほぼ同じレイアウトでその内容を確認することがで
きる。
【0087】さらに、文書のデジタルデータを文書内容
だけでなく属性情報も含めて復元するようにしているの
で、結果として、パソコンなどで作成した文書を紙出力
のみで管理することができるようになるので、二重管理
という問題を生じることがない文書管理方法にすること
ができる。
【0088】次に、本発明に係る文書データ作成部を備
えた文書作成装置および本発明に係る文書データ復元部
を備えた文書復元装置の第2の実施の形態について説明
する。
【0089】この第2の実施の形態による文書作成装置
2および文書復元装置3は、基本的には上記第1の実施
の形態におけるものと同様の構成を備えている。異なる
のは、第1の実施の形態ではユーザが作成した文書の各
文字の全ての属性情報をキャリアフォント文字に付加す
るのに対し、第2の実施の形態では圧縮して付加し、こ
の圧縮して付加された属性情報を復元するという点であ
る。以下、この点について説明する。
【0090】図11は文書作成装置の概略構成を示すブ
ロック図である。なお、文書復元装置の構成は、第1の
実施の形態におけるものと同じである。
【0091】通常、ユーザが任意に作成した文書では、
図6に示すように、行単位または段落単位で、同一のフ
ォント、サイズ、スタイルを有する文字が使用されてい
ることが多い。この場合、キャリアフォント文字には、
フォント、サイズ、スタイルに関して同一の情報コード
が行単位または段落単位で繰り返し付加されることにな
る。
【0092】そこで、第2の実施の形態においては、図
11に示すように、属性情報変換手段35と情報コード
合成手段36との間に情報コード圧縮手段37を設け、
属性情報変換手段35によって得られた情報コードを圧
縮した後に、圧縮済情報コードをキャリアフォント文字
に付加するようにしている。具体的には、情報コード
を、文字位置基準点座標修正データ(x座標、y座標)
のように文字によって固有な情報(以下固有情報とい
う)と、フォント、サイズ、スタイルのように行単位ま
たは段落単位で同一であることの多い情報(以下非固有
情報という)とに分離し、図12(a)(b)に示すフ
ォーマットに当てはめる。さらに、各文字について、走
査順で1つ前の文字と非固有情報が同一であるか否かを
判定し、同一であると判定した場合は、該各文字の非固
有情報を消去して情報コードを圧縮する。なお、文書復
元処理の際、非固有情報が消去された情報コードから元
の全情報コードを復元するために、判定結果を非固有情
報変更フラグとして図8(a)に示すフォーマットに付
加している。第2の実施の形態においては、判定結果が
同一である場合のフラグを「0」、異なる場合のフラグ
を「1」に設定している。
【0093】各文字「旅」「行」「日」「時」「一」
「月」「十」「日」についての圧縮済情報コードを示す
データの一例を図12(c)に示す。図8(b)と図1
2(c)とを比較すると判るように、図6に示した文書
を復元するには、上記第1の実施の形態で用いる情報コ
ードのフォーマットの場合は図8(b)に示すように9
6ビットのデータが必要になるになるのに対して、第2
の実施の形態では64ビットの情報コードで文書の復元
が可能になっていることから情報コードの圧縮ができる
ことが確認できる。
【0094】図13に、情報コード合成後のビットマッ
プデータの一例を示す。このビットマップデータは、図
3(b)に示す情報合成可能画素に、図12(c)に示
す情報コードを順次付加することにより作成されたもの
である。
【0095】一方で、図5に示す文書復元装置3の情報
コード変換手段86において、情報コードの属性情報へ
の変換前に、情報コード分離手段84によって分離され
た情報コードを非固有情報変更有無フラグの情報に応じ
て図8(a)に示すフォーマットに編集し直す。具体的
には、1ビット目の非固有情報変更有無フラグの情報が
「1」である文字に対しては、固有情報として続く4ビ
ットの情報を、非固有情報としてさらに続く8ビットの
情報を分離して図8(a)に示すフォーマットに当ては
める。一方、1ビット目の非固有情報有無フラグの情報
が「0」である場合は、固有情報として続く4ビットの
情報を分離するとともに、非固有情報として該走査順で
1つ前の文字の非固有情報を複写して、同フォーマット
に当てはめる。つまり、この第2の実施の形態における
情報コード変換手段86は、本発明の情報コード復元手
段を兼ねるものとして機能する。これにより、属性情報
の復元を、上記第1の実施の形態と同様にして行なうこ
とが可能になる。
【0096】以上のように、第2の実施の形態において
は、情報コードを圧縮してキャリアフォント文字に付加
するため、同一の情報量を復元するためにキャリアフォ
ント文字に付加すべき情報コード数を、第1の実施の形
態の場合に比べて縮小できる。換言すれば、第1の実施
の形態の場合に比べて復元できる情報量が増加する。こ
れにより、属性情報として、フォント、サイズ、スタイ
ルの情報に加え、例えばアンダーライン指定や倍角指定
などの多種の情報を付加して復元することもできるよう
になる。
【0097】なお、上記各実施の形態においては、文書
作成装置2に画像出力手段40を内蔵しているが、別体
の構成にしてもよい。また、文書復元装置3における画
像入力手段60についても同様である。
【0098】また、上記各実施の形態においては、文字
原稿を例にして説明したが、例えば罫線が含まれるよう
な原稿においても、罫線を構成する“─”,“│”,
“┌”,“ ┐”,“┘”,“└”,“├”,“ ┤”,
“┴”,“ ┬”,“ ┼”といった記号を文字の場合と
同様に規則化して、キャリアフォント文字に組み入れて
おき、さらに属性情報に罫線の太さや、破線等のスタイ
ルを加えることで、文字原稿と同様に罫線を含む原稿に
も本発明を利用することができるようになる。
【0099】なおキャリアフォント文字は一種類である
必要はない。前記文字情報に文字コードと文字位置だけ
ではなく、フォント、サイズも含め、各フォントに対応
するキャリアフォント文字を複数のサイズ分持たせても
よい。こうすれば、本装置で作成されたビットマップデ
ータは、元の文書原稿をより忠実に反映するものとな
る。文字の情報のうち何を属性情報とするかは、生成さ
れるビットマップデータの原稿に対する忠実さの度合い
と、キャリアフォント文字フォント記憶手段の容量との
バランスによって決めればよい。
【0100】また、文書復元装置において、情報コード
を圧縮することなくキャリアフォント文字に付加したも
のと、圧縮済情報コードをキャリアフォント文字に付加
したもののいずれにも対応することができるようにする
には、いずれの形態で情報コードを付加したのかを示す
フラグを追加するとよい。通常は1文書ごとに圧縮済と
するか否かであるので、このフラグは、1つの文書にお
いて、最初の文字の情報コードの先頭ビットb11の前
に1つだけ付加するだけで十分である。
【0101】また、上記各実施の形態においては、従来
のフォント文字を基礎フォント文字として使用し、キャ
リアフォント文字を作成するものとして説明したが、こ
の基礎フォント文字は、どのようなフォント文字を使用
してもよく、今後出現する新たなフォント文字を使用す
ることもできる。例えば、本出願人が特願2000−8
2156号において提案している専用フォント文字を使
用することもできる。この場合、文字認識手段80など
の専用フォント文字と関連する部分については上記特願
2000−82156号に記載のものとするのはいうま
でもない。
【0102】以上説明したように、上記実施の形態によ
る紙DIFシステムにおいては、文書作成装置2におい
て作成された文書の印刷物50を見ただけで、ユーザは
文書の内容を文字だけでなく属性も含めて確認できる
し、また、文書復元装置3において、文書作成装置2に
より作成された文書の印刷物50から、元の文書をパソ
コンやワープロ上で正確に復元させることができる。
【0103】したがって、本発明を文書管理の方法とし
て利用することによって、文書情報を紙出力のみで管理
することができるようになるので、文書内容の確認や検
索が容易にでき、また文書のデジタルデータを誤りなく
復元でき、さらに、二重管理という問題を生じることが
ない文書管理方法を確立することができる。
【図面の簡単な説明】
【図1】キャリアフォント文字のビットマップを作成す
る装置の構成を示すブロック図
【図2】キャリアフォント文字を作成する方法を示すフ
ローチャート
【図3】基礎フォント文字からキャリアフォント文字を
作成する方法を示す図であって、基礎フォント文字のビ
ットマップデータの一例を示した図(a)、情報合成可
能画素を合わせて示した図(b)、情報コードを合成し
た後のビットマップデータの一例を示した図(c)
【図4】本発明の第1の実施の形態による文書作成装置
の概略構成を示すブロック図
【図5】本発明の第1の実施の形態による文書復元装置
の概略構成を示すブロック図
【図6】文書原稿の一例を示す図
【図7】属性情報と情報コードとの対応関係の一例を示
した図
【図8】第1の実施の形態における情報コードのフォー
マットの一例を示した図
【図9】図3(b)中/で示す各情報合成可能画素と図
8(b)に示す各文字の情報コードの各ビットとの対応
関係を示した拡大図
【図10】キャリアフォント文字に情報コードを付加し
た文書の一例を示す図
【図11】本発明の第2の実施の形態による文書作成装
置の概略構成を示すブロック図
【図12】第2の実施の形態における情報コードのフォ
ーマットの一例を示した図(a),(b)、圧縮済情報
コードを示すデータの一例(c)
【図13】情報コードを合成した後のビットマップデー
タの一例を示した図
【符号の説明】
1 ビットマップフォント作成装置 2 文書作成装置 3 文書復元装置 10 基礎フォント文字記憶手段 11 キャリアフォント文字作成手段 20 文字・属性情報抽出手段 30 文書データ作成部 31 キャリアフォント文字記憶手段 32 ビットマップデータ作成手段 33 情報合成可能画素抽出手段 34 属性情報変換テーブル 35 属性情報変換手段 36 情報コード合成手段 40 画像出力手段 50 印刷物 60 画像入力手段 70 文書ビットマップデータ抽出手段 80 文字認識手段 85 情報コード変換テーブル 86 情報コード変換手段 87 文字・属性情報再構成手段 88 文字データ復元部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 文書原稿に基づいて文書のビットマッ
    プデータを作成する文書データ作成方法であって、 前記文書原稿を構成する各文字の情報から文字情報と属
    性情報を抽出し、 該抽出した各文字の文字情報に応じて、所定の規則に基
    づいて作成されたキャリアフォント文字のビットマップ
    を使用して前記文書原稿に対応するビットマップデータ
    を作成し、 前記抽出した各文字の属性情報を第1の変換テーブルに
    基づいて所定の情報コードに変換し、前記作成されたビ
    ットマップデータの各画素のうち所定条件に合致した前
    記情報コードを合成することができる合成可能画素を抽
    出し、 前記情報コードを前記合成可能画素に順次付加すること
    を特徴とする文書データ作成方法。
  2. 【請求項2】 文書原稿に基づいて文書のビットマッ
    プデータを作成する文書データ作成方法であって、 前記文書原稿を構成する各文字の情報から文字情報と属
    性情報を抽出し、 該抽出した各文字の文字情報に応じて、所定の規則に基
    づいて作成されたキャリアフォント文字のビットマップ
    を使用して前記文書原稿に対応するビットマップデータ
    を作成し、 前記抽出した各文字の属性情報を第1の変換テーブルに
    基づいて所定の情報コードに変換し、該情報コードを所
    定の条件に従って圧縮して圧縮済情報コードを生成し、
    前記作成されたビットマップデータの各画素のうち所定
    条件に合致した前記圧縮済情報コードを合成することが
    できる合成可能画素を抽出し、 前記圧縮済情報コードを前記合成可能画素に順次付加す
    ることを特徴とする文書データ作成方法。
  3. 【請求項3】 請求項1記載の文書データ作成方法を使
    用して作成された文書のビットマップデータから文書の
    文字データを復元する方法であって、 前記文書のビットマップから各文字の前記情報コードを
    抽出し、第2の変換テーブルを参照して前記抽出した情
    報コードを属性情報に変換し、 該抽出した情報コードを前記文書のビットマップから除
    去し、該情報コードが除去されたビットマップに基づい
    て文字認識を行なって文字情報を復元することを特徴と
    する文字データ復元方法。
  4. 【請求項4】 請求項2記載の文書データ作成方法を使
    用して作成された文書のビットマップから文書の文字デ
    ータを復元する方法であって、 前記文書のビットマップから各文字の前記圧縮済情報コ
    ードを抽出し、抽出した圧縮済情報コードを復元して圧
    縮前の情報コードを求め、第2の変換テーブルを参照し
    て前記求めた情報コードを属性情報に変換し、 前記抽出した圧縮済情報コードを前記文書のビットマッ
    プから除去し、該圧縮済情報コードが除去されたビット
    マップに基づいて文字認識を行なって文字情報を復元す
    ることを特徴とする文字データ復元方法。
  5. 【請求項5】 復元した文字情報に対して、前記変換さ
    れた属性情報に基づいて修飾を施すことを特徴とする請
    求項3または4記載の文字データ復元方法。
  6. 【請求項6】 文書原稿に基づいて文書のビットマッ
    プデータを作成する文書データ作成装置であって、 所定の規則に基づいて作成されたキャリアフォント文字
    のビットマップデータを記憶するキャリアフォント文字
    記憶手段と、 前記文書原稿を構成する各文字の情報から文字情報と属
    性情報を抽出する文字・属性情報抽出手段と、 該抽出した各文字の文字情報に応じて、前記キャリアフ
    ォント文字記憶手段からキャリアフォント文字のビット
    マップを読み出して前記文書原稿に対応するビットマッ
    プデータを作成するビットマップデータ作成手段と、 前記抽出した各文字の属性情報を第1の変換テーブルに
    基づいて所定の情報コードに変換する属性情報変換手段
    と、 前記作成されたビットマップデータの各画素のうち所定
    条件に合致した前記情報コードを合成することができる
    合成可能画素を抽出する情報合成可能画素抽出手段と、 前記情報コードを前記合成可能画素に順次付加する情報
    コード合成手段とを備えたことを特徴とする文書データ
    作成装置。
  7. 【請求項7】 文書原稿に基づいて文書のビットマッ
    プデータを作成する文書データ作成装置であって、 所定の規則に基づいて作成されたキャリアフォント文字
    のビットマップデータを記憶するキャリアフォント文字
    記憶手段と、 前記文書原稿を構成する各文字の情報から文字情報と属
    性情報を抽出する文字・属性情報抽出手段と、 該抽出した各文字の文字情報に応じて、前記キャリアフ
    ォント文字記憶手段からキャリアフォント文字のビット
    マップを読み出して前記文書原稿に対応するビットマッ
    プデータを作成するビットマップデータ作成手段と、 前記抽出した各文字の属性情報を第1の変換テーブルに
    基づいて所定の情報コードに変換する属性情報変換手段
    と、 該変換された情報コードを所定の条件に従って圧縮して
    圧縮済情報コードを生成する情報コード圧縮手段と、 前記作成されたビットマップデータの各画素のうち所定
    条件に合致した前記圧縮済情報コードを合成することが
    できる合成可能画素を抽出する情報合成可能画素抽出手
    段と、 前記圧縮済情報コードを前記合成可能画素に順次付加す
    る情報コード合成手段とを備えたことを特徴とする文書
    データ作成装置。
  8. 【請求項8】 請求項6記載の文書データ作成装置によ
    り作成された文書のビットマップから文書の文字データ
    を復元する文字データ復元装置であって、 前記文書のビットマップから各文字の前記情報コードを
    抽出する情報コード抽出手段と、 第2の変換テーブルを参照して前記抽出した情報コード
    を属性情報に変換する情報コード変換手段と、 前記抽出した情報コードを前記文書のビットマップから
    除去する情報コード除去手段と、 該情報コードが除去されたビットマップに基づいて文字
    認識を行なって文字情報を復元する文字認識手段とを備
    えたことを特徴とする文字データ復元装置。
  9. 【請求項9】 請求項7記載の文書データ作成装置によ
    り作成された文書のビットマップから文書の文字データ
    を復元する文字データ復元装置であって、 前記文書のビットマップから各文字の前記圧縮済情報コ
    ードを抽出する情報コード抽出手段と、 抽出した圧縮済情報コードを復元して圧縮前の情報コー
    ドを求める情報コード復元手段と、 第2の変換テーブルを参照して前記復元した情報コード
    を属性情報に変換する情報コード変換手段と、 前記抽出した圧縮済情報コードを前記文書のビットマッ
    プから除去する情報コード除去手段と、 該圧縮済情報コードが除去されたビットマップに基づい
    て文字認識を行なって文字情報を復元する文字認識手段
    とを備えたことを特徴とする文字データ復元装置。
  10. 【請求項10】 復元した文字情報に対して、前記変換
    された属性情報に基づいて修飾を施す修飾手段を更に備
    えたことを特徴とする請求項8または9記載の文字デー
    タ復元装置。
JP2000084848A 2000-03-24 2000-03-24 文書データ作成方法および装置並びに文字データ復元方法および装置 Expired - Fee Related JP3731800B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000084848A JP3731800B2 (ja) 2000-03-24 2000-03-24 文書データ作成方法および装置並びに文字データ復元方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000084848A JP3731800B2 (ja) 2000-03-24 2000-03-24 文書データ作成方法および装置並びに文字データ復元方法および装置

Publications (2)

Publication Number Publication Date
JP2001274976A true JP2001274976A (ja) 2001-10-05
JP3731800B2 JP3731800B2 (ja) 2006-01-05

Family

ID=18601269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000084848A Expired - Fee Related JP3731800B2 (ja) 2000-03-24 2000-03-24 文書データ作成方法および装置並びに文字データ復元方法および装置

Country Status (1)

Country Link
JP (1) JP3731800B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008193580A (ja) * 2007-02-07 2008-08-21 Ricoh Co Ltd 情報処理装置
JP2015158865A (ja) * 2014-02-25 2015-09-03 株式会社リコー 文書作成装置、サーチャブルファイル作成装置、及び文書作成方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008193580A (ja) * 2007-02-07 2008-08-21 Ricoh Co Ltd 情報処理装置
JP2015158865A (ja) * 2014-02-25 2015-09-03 株式会社リコー 文書作成装置、サーチャブルファイル作成装置、及び文書作成方法

Also Published As

Publication number Publication date
JP3731800B2 (ja) 2006-01-05

Similar Documents

Publication Publication Date Title
US7681121B2 (en) Image processing apparatus, control method therefor, and program
JP4854491B2 (ja) 画像処理装置及びその制御方法
US8520006B2 (en) Image processing apparatus and method, and program
EP2264995B1 (en) Image processing apparatus, image processing method, and computer program
US5793903A (en) Multimedia rendering marker and method
JP4904175B2 (ja) 低解像度のグリフ・イメージから高忠実度のグリフ・プロトタイプを作成するための方法および装置
US7421124B2 (en) Image processing system and image processing method
US20060008113A1 (en) Image processing system and image processing method
JP2000306103A (ja) 情報処理装置及び方法
JP4194462B2 (ja) 電子透かし埋め込み方法、電子透かし埋め込み装置、及びそれらを実現するプログラム並びにコンピュータ可読記憶媒体
US7965293B2 (en) Image processing device, image processing method, and image processing program for reconstructing data
US7453594B2 (en) Document filing apparatus for storing information added to a document file
JP2004246577A (ja) 画像処理方法
JP2001274976A (ja) 文書データ作成方法および装置並びに文字データ復元方法および装置
JP2007129557A (ja) 画像処理システム
JPH0818790A (ja) ハーフトーン画像の圧縮方式
JP3823005B2 (ja) ビットマップフォント作成装置および文書復元装置
JP4164458B2 (ja) 情報処理装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2644477B2 (ja) 画像処理方法
JPH07121734A (ja) 文字画像編集装置
CN100511267C (zh) 图文影像处理装置及其影像处理方法
JP2004072558A (ja) 電子白板および電子白板のデータ出力方法
JP2005157905A (ja) 画像処理装置、画像処理方法およびプログラム
JP2840355B2 (ja) 文書処理装置
JP4618609B2 (ja) 個人筆跡による記帳方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040817

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050524

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050722

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050913

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051006

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091021

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101021

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111021

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees