JP5482223B2

JP5482223B2 - 情報処理装置、情報処理方法

Info

Publication number: JP5482223B2
Application number: JP2010012334A
Authority: JP
Inventors: 慶久大黒
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2010-01-22
Filing date: 2010-01-22
Publication date: 2014-05-07
Anticipated expiration: 2030-01-22
Also published as: JP2011150599A

Description

本発明は、文書を担う原画像データのレイヤーに対し、該文書を構成する文書情報と対応付けて関連する付加情報を別レイヤーとして、付加情報の画像を原画像へ挿入するマルチレイヤー構成の画像データを処理する情報処理装置、情報処理方法に関する。

従来から、文書を画像データ化し、得られる画像データをもとに印刷もしくは画面表示の形で画像出力を行う際に、用途に適した形態で出力を行わせるために、原画像データをユーザーの意図に沿って加工する手段が用いられている。
こうした加工を行う文書処理装置には、ユーザーの操作による指示が容易に行えるようにするために、処理対象とする文書において処理範囲を指定して一括変更指示を行なう機能を備えているものが多く提案されている。
特許文献１〜４は、一括変更指示を行なう機能を備えた従来の文書処理装置を例示するものである。
これらの従来技術により例示される一括変更指示を行なう機能は、いずれも一括変更の対象を指定する条件として、下記ａ．及びｂ．の２種類を考慮し、柔軟な一括変更を実現することを意図している。
ａ．文書における文字、図、写真等の表示属性
ｂ．書式（文書の体裁に関する設定）

また、画像データ化した文書を画像出力する際、上記のように原画像データの表示属性や書式を変更する方法ではなく、画像データを追加する、即ち重ね合わせることによって出力形態を変える方法があり、例えば、特許文献５を示すことができる。
特許文献５には、原画像データのレイヤーとは別に、アノテーションの画像データのレイヤーを構成するファイルを作成、つまり複数レイヤーの画像データのファイルを作成し、作成した複数レイヤーの画像データをもとに、原画像に予定したアノテーション画像を重ね合わせ１画像として出力する方法が記載されている。

しかしながら、上記した複数レイヤーの画像データをもとに一つの画像出力を行う従来技術における文書の処理では、原文書とアノテーションとを単に重ね合わせて表示（出力）することを目的として、原文書とアノテーションの各レイヤーを分離して管理し、アノテーションをどの原文書に追加する（重ね合わせる）かが指定できるようにしているだけで、原文書の内容に応じて追加する画像を変化させることができないので、利便性が低い。
また、上記した一括変更指示を行なう従来技術の機能は、表示属性や書式の変更を行うための機能であり、例えば、文字で表された文書のように、表示属性や書式が同じであっても文書の情報の種類が異なることがある文書を対象にする場合、情報内容によっては、一括変更すると、利用者が望まない範囲にまで変更が及ぶおそれがある。

本発明は、文書を担う原画像のレイヤーに対し別レイヤーとして該文書の文書情報と関連する付加情報を挿入してマルチレイヤー機能を有するファイルを作成する処理における上述の従来技術の問題に鑑みてなされたもので、その目的は、原画像のレイヤーに対して、ユーザーの要求する形態で付加情報を挿入することを可能にし、ユーザーの利便性を高めることにある。

本発明は、文書を担う原画像データのレイヤーに対し、別レイヤーの画像データとして前記文書の文書情報に対応付けて該文書情報と関連する付加情報を挿入してマルチレイヤー機能を有するファイルを作成する処理を行う情報処理装置であって、前記文書情報と関連する複数の付加情報をそれぞれ該文書情報に対応付けて登録し、異なる種類のデータベースを構築する付加情報データベースと、
前記原画像データから文書情報を認識し、抽出される文書情報のうち前記付加情報を挿入する処理の対象となる文書情報を取得する文書情報取得部と、前記文書情報取得部によって取得された文書情報に挿入する付加情報を前記付加情報データベースから取得する追加情報取得部と、前記追加情報取得部によって取得された付加情報の挿入形態を付加情報データベースの種類ごとに指定する挿入形態指定部と、前記挿入形態指定部によって指定された挿入形態に従い、原画像データのレイヤーに対し別レイヤーとして挿入する付加情報の画像データを生成する追加情報データ処理部とを有し、前記追加情報データ処理部は、挿入する付加情報に該付加情報が登録されたデータベースの識別情報を付記することを特徴とする情報処理装置である。

本発明によれば、画像データの文書に関連する付加情報が、所望の形態で利用でき、しかもユーザーにかかる手間を少なくすることが可能になり、利便性を向上することができる。

本発明の情報処理装置の実施形態に係るハードウェア構成を示すブロック図である。マルチレイヤー機能を有するファイルとしてのサーチャブルＰＤＦの一例を示す図である。原画像の文書情報の加工（レイヤーの挿入）を伴うサーチャブルＰＤＦの処理過程を説明する図である。原画像の文書情報に関連する付加情報（外部情報源から取得）の加工を伴うサーチャブルＰＤＦの処理過程を説明する図である。付加情報の挿入モードを指定可能にしたサーチャブルＰＤＦに係る処理フローの１例を示す概略図である。表示例（Ａ）を記述する先行技術に係る単語訳付きサーチャブルＰＤＦの記述例（Ｂ）及び記述例（Ｂ）に示すオペレーションとオペランドの定義（Ｃ）を説明する図である。図６の表示例（Ａ）を記述する本実施形態に係る単語訳付きサーチャブルＰＤＦの記述例を説明する図である。図６の表示例（Ａ）を記述する本実施形態に係る単語訳付きサーチャブルＰＤＦの他の記述例を説明する図である。指定した文書情報のみを対象に表示形態を変更する処理のフローを示す図である。通信回線で互いに結ばれた情報処理装置を利用して本発明の情報処理装置を構成するシステムの構成例を示す図である。

本発明の実施形態について、添付図面を参照して説明する。以下に示す実施形態は、本発明に係る情報処理装置を、紙を媒体とする文書からスキャナ読取りを通して原画像データを生成し、生成した画像データをもとにマルチレイヤー機能を有するファイルへと処理し、印刷もしくは画面表示の形でファイルの画像出力を可能とする画像処理装置もしくは画像処理システムとして実施した例を示す。ここに、マルチレイヤー機能を有するファイルは、複数のレイヤーを定義可能で、レイヤー毎にデータの書き込み／読み出しが可能なファイルである。この実施形態では、生成した文書を担う原画像データを１つのレイヤーとし、この原画像のレイヤーに対し、別レイヤーの画像データとして、前記文書の文書情報と対応付けて関連する付加情報を原画像へ挿入する構成のファイルであり、文書情報から対応する付加情報のサーチを可能とするサーチャブル機能を実現するものである。
なお、原画像データを生成する方法は、画像データから文書情報が認識できさえすれば、スキャナ読取り以外の方法でもよい。また、画像出力についても、ユーザーが利用する形態の多くは、印刷、表示の形をとるが、実施形態によっては、画像出力の実行手段を持たない画像処理装置もしくは画像処理システムでも実施し得る。

「情報処理装置の構成」
図１は、本実施形態に係る情報処理装置のハードウェア構成を示すブロック図である。
この情報処理装置は、バス１と、それぞれがバス１に接続されたＣＰＵ（Central Processing Unit）２、メモリ３、通信装置４、表示装置５、ＨＤ（Hard Disk）ドライブ６、入力装置７、ＣＤ（Compact Disk）−ＲＯＭ（Read Only Memory）ドライブ８、ＦＤ(Flexible Disk)ドライブ９及びＩＦ（インターフェース）１５を備えている。

ＣＰＵ２は、この情報処理装置の動作制御を行うものである。メモリ３は、ＣＰＵ２が起動時に実行するプログラムや必要なデータ等を記憶するためのＲＯＭ（Read Only Memory）、ＣＰＵ２のワークエリア等を構成するためのＲＡＭ（Random Access Memory）などからなる。
ＣＰＵ２は、ＲＡＭをワークメモリとして用いることにより、ＲＯＭ、ＨＤドライブ６等に格納されたソフトウェア（プログラム）を動作させ、これらの要素で構成するコンピュータを動作制御部として機能させる。このコンピュータは、本実施形態では、後述するマルチレイヤー機能を有するファイルの作成及びファイルを用いて行う画像出力に係る処理を実行するためのプログラムを駆動することにより、これらの処理手段として機能する。
通信装置４は、この情報処理装置をインターネットなどの通信回線に接続し、外部の情報処理装置等とのデータ交換を行うための装置である。

表示装置５は、液晶ディスプレイなどからなり、この画像処理装置を操作するための画面や動作状態を表示する。
入力装置７は、キーボードやマウスなどからなり、この情報処理装置に対する種々のキー操作や指示の入力を行うためのものである。

ＨＤドライブ６は、種々のアプリケーションプログラム、ワークデータ、及びファイルデータなどを記憶する。ＣＤ−ＲＯＭドライブ８は、ＣＤ−ＲＯＭやＤＶＤ−ＲＯＭなどの記録媒体の読み出しを行うための装置である。ＦＤドライブ９は、フレキシブルディスクに対する書き込み及び読み出しを行うための装置である。
ＩＦ１５は、接続する外部デバイス(周辺機器)との間でデータをやり取りするための装置であり、この実施形態では画像処理装置(システム)を構成するので、スキャナ、プリンタ等の外部デバイス１６がこのＩＦを介して接続される。

「マルチレイヤー機能を有するファイル」
本実施形態の情報処理装置は、マルチレイヤー機能を有するファイルを扱うので、まずマルチレイヤー機能を有するファイルの一例としてサーチャブルＰＤＦ（Portable Document Format）について説明する。なお、以降、ＰＤＦを例に説明するが、ＰＤＦに代表されるマルチレイヤー機能をもつ電子文書において、一般的に具備している要素のみに言及するものであり、本発明はＰＤＦに限らず、マルチレイヤー機能をもつ電子文書全般に適用できることは言うまでもない。また、電子文書の構成として多層である必要はなく、何らかの手段で文書要素群を層状に分離／重複可能であれば、この実施形態を適用し得るマルチレイヤー機能にあたる。

図２は、サーチャブルＰＤＦの一例を説明する図である。なお、サーチャブルＰＤＦは、透明テキスト付きＰＤＦともいわれる。図２の（Ａ）は、透明テキスト付きＰＤＦを示し、図２の（Ｂ）はそのレイヤーを示す。図２（Ｂ）のように、文書を担う原画像データ（以下、「原画像」もしくは「原文書」ともいう)中の文字画像１１ａのＯＣＲ（Optical Character Reader）結果であるテキスト１２ａを、原画像のレイヤー２１１とは別のレイヤー２１２において文字画像１１ａの直上に、つまり文字画像の位置にテキストを対応させて、不可視色、即ち透明で配置し、画像の見栄えを変更することなく、ＯＣＲ結果と統合したものが、図２（Ａ）に示す透明テキスト付きＰＤＦ２１である。ＰＤＦファイルの編集ツールであるAcrobat（登録商標）を用いることによって、文字画像をもとにするテキストのサーチや、透明テキストに着色すれば、通常のテキストファイルとして、表示等の出力に利用すること、あるいはデータ加工を施すこともできる。なお、元の透明テキストに戻すこと、例えば表示したテキストを画面から消すことも可能である。

さらに、サーチャブルな透明テキスト付きＰＤＦのテキスト情報に基づいて、情報の追加を可能とするアプリケーションもあり、このアプリケーションによってサーチ機能をより高度化することができる。例えば、英文原稿の透明テキスト付きＰＤＦに含まれる単語を英和辞書で検索し、訳語を追加するアプリケーションが考えられる。
このように、サーチャブルＰＤＦのようなマルチレイヤー機能をもつ電子文書フォーマットを利用すれば、原文書に対して、外部の情報源から、原文書に関連した情報を付加し、文書の価値を高めていくことが可能となる。

「サーチャブルＰＤＦの作成」
ここで、上記したサーチャブルな透明テキスト付きＰＤＦを作成する処理過程を図３及び図４の概念図にもとづいて説明する。
図３は、原画像から認識される文書情報（例えば文字画像）にテキストを対応させ、透明テキスト付きＰＤＦを作成する処理を説明する図である。
図３に示すように、まず処理対象の原画像にＯＣＲ１２を用いて文字画像を認識し、文字情報を抽出する。次に、抽出した文字情報のテキストを、付加情報源１４としての文字情報とテキストデータとが関連付けて登録されているデータベースから取得する。
次いで、取得したテキストを原画像における文字画像の位置に対応させて、原画像のレイヤーとは別のレイヤーとして挿入するデータを透明テキストとして生成し、こうした加工を行うことにより、原画像が担う文字の認識結果を付加した透明テキスト付きＰＤＦを作成する。なお、この実施形態の画像処理装置は、作成したサーチャブル（透明テキスト付き）ＰＤＦを用いて印刷、配信等の出力処理を行う。

また、図４は、外部の付加情報源から取得し、得られる付加情報を別レイヤーとして挿入した付加情報付きサーチャブルＰＤＦを作成する処理を説明する図である。この処理は、上記した透明テキストレイヤーの付加処理（図３、参照）を前提に、前段で原画から認識される文書情報や付加したテキストと関連する情報として、外部の付加情報源から得られる情報をさらに付加したサーチャブルＰＤＦを作成する処理である。
外部の付加情報源から得られる情報を付加する処理は、処理対象がテキストである場合、図３の処理過程で説明したと同様に、原画像から抽出した文字情報のテキストを取得し、その後、得たテキストをもとに、外部の付加情報源１４ｅからこのテキストと関連する付加情報をさらに取得する。外部の付加情報源１４ｅは、例えば、各種の辞書類であり、テキストの文字（単語）の読み方、意味等の解説を記載した辞書データベースであり、この付加情報源１４ｅを利用して付加情報を取得する。

よって、図４（Ａ）に示すように、外部の付加情報源１４ｅを利用してテキストに関する解説を付加情報として挿入する場合のサーチャブルＰＤＦを作成する処理過程では、上記透明テキストの加工（図３、参照）に加えて、外部の付加情報源１４ｅとしての辞書データベースから取得したこのテキストに関する解説等の付加情報を別のレイヤーとして挿入するデータを生成し、サーチャブルＰＤＦの１レイヤーとして追加することにより、用語解説付きのサーチャブルＰＤＦを作成する。

図４（Ａ）は、外部の付加情報源１４ｅが１つである場合を想定した処理概念を示すものであるが、外部の付加情報源１４ｅが複数ある場合を想定した場合には、同図（Ｂ）に示すように、外部の複数付加情報源１４ｅ−１，１４ｅ−２，１４ｅ−３，・・・それぞれからテキストに関連する解説を付加情報とするレイヤーをサーチャブルＰＤＦのレイヤーとして追加する。
例えば、外部の複数付加情報源１４ｅが英和辞書のデータベースで、辞書の種類を、汎用の基本辞書（以下「基本辞書」という）、ユーザーにカスタム化した辞書（以下「ユーザー辞書」という）或いは専門用語の辞書（以下「専門語辞書」という）等の種類として、後記で詳述するように、これらを使い分けることを可能にしたい場合には、外部の複数付加情報源１４ｅ−１，１４ｅ−２，１４ｅ−３，・・・それぞれに対応したレイヤーをサーチャブルＰＤＦのレイヤーとして挿入するデータを生成し、追加することにより、翻訳情報付きのサーチャブルＰＤＦを作成する。

“付加情報に対する利用形態の選択”
ところで、サーチャブルＰＤＦにおいて、原文書の作成者とＰＤＦ文書の使用者とは一般的には異なり、両者の間で必要とする付加情報（テキストに関連して追加される情報）が違い、一方で利用価値が高い付加情報でも他方では高くなるとは限らない。また、文書作成者と文書使用者が同じ場合でも、状況によって、付加情報の利用価値に違いが生じるのは、自然である。
例えば、付加情報が不要な文書利用者にとっては、付加情報は不可視であることが望ましいし、小さな字が見えにくい利用者にとっては、付加情報は大きなフォントを用いて表示することが望まれる。

つまり、付加情報の利用形態は、文書作成者が指定したまま固定であるよりは、文書利用者の希望に応じて変更可能であることが好ましい。
上記で前提技術として述べた透明テキスト付きＰＤＦであれば、既存のAcrobat等の編集ツールを用いれば、原画から認識される文書情報（文字等）に対応付けられる付加情報（ここではテキスト）の単位で、その利用形態を変更することは可能である。例えば、付加情報としてのテキストに用いられている文字が小さい場合には、ユーザーはより大きな文字を指定することで、所望の大きさのフォントに変更可能である。また、所望のテキストをコピー＆ペーストし、取り出すことも可能である。
ただ、この操作は、付加情報としてのテキスト（文字、単語等）の単位で処理対象を指定した上で編集指示をする必要があり、編集個所が多い場合には非常に手間がかかってしまう。このように、付加情報の利用形態を変更することが可能であっても、その操作に手間がかかってしまい、利便性が損なわれる。

そこで、既存のAcrobat等の編集ツールを用いることによる場合に生じる上記の問題を解決し、利便性の向上を図るために、本実施形態では、付加情報源ごとに利用目的や利用分野が異なることを前提として、付加情報源ごとに利用形態を選択する指示ができるサーチャブルＰＤＦを作成できるようにする。
上記で図４の概念図を参照して説明したように、付加情報は、目的別あるいは分野別に分類された複数の付加情報源１４ｅ−１，１４ｅ−２，１４ｅ−３，・・・を用意しておき、そのなかから、原文書を利用する際に有用な情報源として選択する付加情報源１４ｅを指定し、取得される付加情報を望ましい形態で利用するための利用形態を選択可能とする。
付加情報は情報源別に利用目的が明確であるから、文書使用者は、自身の利用目的にあう情報源を選択することは容易である。

上述のように、付加情報の利用目的は使用者ごとに異なるから、付加情報の情報源ごとに一括して利用形態を指定可能にしておけば、変更に必要なユーザーの操作負担を最小限に抑えて、多くのユーザーの希望に応えることが可能となる。
例えば、翻訳情報付きの文書を編集する際、付加情報源として、１．基本辞書、２．専門語辞書、３．ユーザー辞書の３種が用意されている場合に、この３種の付加情報源から翻訳情報を付加して作成される文書が有効利用されるようにするためには、語学力の上級者であれば、１．基本辞書は不要であり、初級者であれば、１．基本辞書、２．専門語辞書、３．ユーザー辞書すべてを必要とする利用形態が適当となる。
したがって、作成するサーチャブルＰＤＦにおける指示は、上級者は付加情報源の１．基本辞書から取得される付加情報に対する指示を不可視にし、初級者は付加情報に対する指示を行わず、そのまま利用する（後述する図６（Ｃ）に示すＰＤＦのオペレーションとオペランドの定義に関する説明、参照）。また、原文書のみを閲覧したい場合には、全ての付加情報源１４ｅからの付加情報を不可視にする利用形態によって実施することができる。
このように、ユーザーが望む利用形態は、ユーザー自身により付加情報源１４ｅを指定し、取得される付加情報をどのような形態で挿入するかを指定することによって指示される。つまり、付加情報の挿入形態がユーザーによって指示される。

“ＰＤＦの作成過程”
ここで、ユーザーの指示により挿入形態を定める本実施形態におけるサーチャブルＰＤＦの処理について、図５に示すこの処理フローの１例を示す概略図を参照して説明する。なお、この処理は、基本的には、図３及び図４を参照して概念的に説明した処理過程に従う。
図５に例示する処理フローによるＰＤＦの処理は、原文書の原稿からスキャナ読取りで原画像データを生成し、情報処理装置１００が行う一連の初期処理により、一旦ＰＤＦを完成させる。この段階で得られるＰＤＦは、複数の付加情報源１４ｅ全部から取得した付加情報を付け、情報処理装置１００側で予めデフォルトとして定めた挿入形態を指定する付加情報レイヤーを有するファイルとする。この後、ユーザーの要求する挿入形態の指示は、一旦完成させたＰＤＦに対し、デフォルト設定を変更する形で付加情報源ごとに挿入形態を指定する追加編集を行い、この編集結果を反映したＰＤＦが求めるサーチャブルＰＤＦとなる。

図５の処理の流れに従い、本情報処理装置１００（図１、参照）が行うサーチャブルＰＤＦの処理をより詳しく説明する。
なお、このサーチャブルＰＤＦの処理は、当該処理の処理手段として機能する情報処理装置１００のコンピュータが行う。つまり、情報処理装置１００のコンピュータは、上記したように、マルチレイヤー機能を有するファイルの作成及びこのファイルを用いて行う画像出力に係る処理を実行するためのプログラムを駆動することにより、これらの処理の処理手段として機能する。したがって、情報処理装置１００のコンピュータ（ＣＰＵ２）は、以下に記載するマルチレイヤー機能を有するファイルとしてのサーチャブルＰＤＦの作成処理過程に含まれる処理に係る下記の文書情報取得部、追加情報取得部、挿入形態指定部、追加情報データ処理部の各処理部を要素とする処理手段を構成する。
情報処理装置１００のＣＰＵ２は、サーチャブルＰＤＦの処理を実行するプログラムを起動し、まず、原文書の原稿からスキャナで読取った原画像データをもとに画像ファイルを生成する（ステップＳ１０１）。この原文書の画像ファイルの生成過程では、ＩＦ１５を介して外部デバイス１６として接続したスキャナを動作させ、ビットマップの画像データとして原稿文書の読取画像を取得し、このデータをもとに、ＰＤＦのファイル形式の画像データを作成する。ＰＤＦは、テキスト情報の他、フォントやレイアウト等の情報をファイル内に含む。このため、ステップＳ１０１では、上述で図３を参照して説明した処理や加工、即ちＯＣＲによる文字情報の抽出、文字情報に対応する付加情報としてのテキストの取得及び得たテキストを透明テキストとして原画像に挿入する透明テキストレイヤーの生成、を行う。ここでは、上記した、ＯＣＲによる文字情報の抽出を行う処理手段を文書情報取得部といい、また、文字情報に対応する付加情報としてのテキストの取得を行う処理手段を追加情報取得部という。

次に、前段で生成した画像ファイルに対して、用意されている所定の付加情報源から当該テキストに関連する情報として取得した情報をさらにそれぞれ別レイヤーとして付加する加工をする（ステップＳ１０２）。所定の付加情報源として、この実施形態では、テキストとテキストに関連する情報を対応付けて登録し、ＣＰＵ２がアクセス可能なデータベース（例えば、各種の辞書データベース）をＨＤドライブ６等の記憶媒体に構築する。ステップＳ１０２の加工過程では、前段で生成した原文書の画像ファイルに対し、図４を参照して説明した処理や加工、即ち図４（Ｂ）のように付加情報源が複数あることを前提に、各付加情報源（データベース）１４ｅ−１，１４ｅ−２，１４ｅ−３，・・・から取得した付加情報をもとに、付加情報源それぞれに対応したレイヤーをサーチャブルＰＤＦのレイヤーとして挿入するデータを生成し、追加することにより、複数の異なる種類の情報を付加したサーチャブルＰＤＦを作成する。
複数の付加情報源１４ｅ全部から取得した付加情報を付け、この処理プログラムによって予めデフォルトとして定めた挿入形態を指定した段階で、サーチャブルＰＤＦは、一旦完成する。

次のステップでは、ユーザーの操作により、付加情報源１４ｅを指定し、取得される付加情報をどのような形態で挿入するかを指定することによって、ユーザーが望む利用形態を指示し、この指示に従って別レイヤーの追加編集をする（ステップＳ１０３）。
ここでは、上記した利用形態を指示する処理手段を挿入形態指定部といい、また、別レイヤーの追加編集をする処理手段を追加情報データ処理部という。
上記した利用形態の指示は、ユーザーインターフェースとして機能する表示装置５及び入力装置７を用いて行うユーザーの操作により、一旦完成させたＰＤＦに対し、デフォルト設定を変更する形で行う。ここでは、サーチャブルＰＤＦの追加編集として、付加情報をどのような形態で挿入するかを決める挿入形態の指定の変更をする。
例えば、
“「ユーザー辞書」の付加情報を「不可視」にする”という指定をすれば、このＰＤＦを用いて実行する印刷や表示においてユーザー辞書から取得した付加情報の画像出力を一括して無くすことができ、
“「難易度３未満」の付加情報を「不可視」にする”という指定をすれば、難易度に応じて辞書を使い分けることができ、
“「付加情報の文字サイズ」を「１０ポイント」にする”という指定をすれば、付加情報の画像出力を一括してユーザー所望の文字サイズにすることができる。
なお、挿入形態の指示についての詳細は、後述する“サーチャブルＰＤＦの記述”にて説明する。

次に、ユーザーの操作に従いステップＳ１０３で作成されたサーチャブルＰＤＦに対し印刷の実行が指示されると、デフォルト設定された挿入形態を変更する形で行った追加編集によって作成されたＰＤＦデータの印刷コマンドを外部デバイス１６として接続したプリンタにＩＦ１５を介して送信する。この印刷コマンドを受取るプリンタは、ＰＤＦデータをもとにユーザー所望の挿入形態の画像の印刷を行う（ステップＳ１０４）。
他方、ステップＳ１０３で作成されたサーチャブルＰＤＦに対し外部装置への配信が要求されると、上記と同様に追加編集によって作成されたＰＤＦデータの配信を通信装置４に指示する。この配信の指示を受ける通信装置４は、ユーザー所望の挿入形態のＰＤＦデータを送信先の外部装置に通信回線を介して配信する（ステップＳ１０５）。ＰＤＦデータの配信は、例えば、インターネットを通信回線とする電子メールを利用することができる。

“サーチャブルＰＤＦの記述”
具体的な文書画像を例に、画像出力が可能なサーチャブルＰＤＦとして作成されるファイルに関する説明をする。
ここでは、サーチャブルＰＤＦを用いて画面表示等を行ったときの出力画像例として示す図６（Ａ）を定義するサーチャブルＰＤＦの記述を例示する。
図６（Ａ）の出力画像例は、
１．原文書：英文文書画像
２．付加情報源(1)：英文文書画像からＯＣＲ結果として得た英単語（文字、文字列）；透明色にて元画像の文字の上に貼付
３．付加情報源(2)：英和辞書から英単語の和訳として得た語句（文字、文字列）；可視色(緑色)にて英単語の下にルビ状に貼付
の１〜３を出力条件とする。
つまり、図６（Ａ）の表示例は、英文の原文書における単語の一部に付加情報としての日本語訳を緑色（同図では英文に比べ細字にて示す）でルビ状にもしくは添え字で挿入する単語訳情報付きＰＤＦの例を示す。

先ず、本発明が基礎とする既存のサーチャブルＰＤＦの記述例を示す図６（Ｂ）を参照して、図６（Ａ）の表示を行うためのサーチャブルＰＤＦの記述を説明する。
なお、図６（Ｃ）には、記述例の図６（Ｂ）に示すオペレーション（図中、太字で示す）とオペランド（図中、普通字で示す）の意味を、
font size Tf：カレントフォント（font）とカレントフォントサイズ（size）を設定
x y Td：カレントを相対座標（x,y）に移動
string Tj：string（文字列型のデータ）を表示
r g b. rg.：塗りつぶしの色（r g b）を指定
T_mode Tr：レンダリングモード（T_mode）の設定
（T_mode 0:縁どり，2:塗りつぶし＋縁どり，3:無表示，4-7:0-3 の処理の後、クリッピングに追加）
として、まとめて示す。

図６（Ｂ）の１行目の「0 Tr 0 1 0 rg 」は、図６（Ｃ）の定義に基づいて解釈すると、「0 Tr」がレンダリングモードを0（＝塗りつぶし）に設定し、「0 1 0 rg」が塗りつぶしの色を緑（rgb ＝ 010）に指定することを意味する。
図６（Ｂ）の２行目の「-184.7 -48.6 Td (適用する) Tj」は、相対座標（-184.7,-48.6)に移動して文字列「適用する」を表示することを意味する。なお、フォントのサイズや色などは現在の設定値に従うので、文字列「適用する」は、緑で可視色として表示される。
図６（Ｂ）の３，４行目も２行目の「-184.7 -48.6 Td (適用する) Tj」と同様に解釈される。
図６（Ｂ）の５行目の「/F10 9 Tf」は、現在のフォントを/F10、サイズを9に設定することを意味し、２〜４行目に指示された文字列はこの設定で表示される。

図６（Ｂ）の６行目の「3 Tr」は、レンダリングモードを3：無表示（透明＝不可視）に設定することを意味する。なお、サーチャブルＰＤＦにおいて、通常、レンダリングモードは、表示を行う0：塗りつぶしがデフォルトで設定されるが、原画像にあるstringの英文に対しては、原画像のレイヤーがあるので、無表示とする。
図６（Ｂ）の７行目の「-149.2 3.3 Td (You must apply in person at any Social Secu-) Tj」は、相対座標（-149.2 3.3)に移動して文字列「You must apply in person at any Social Secu-」を挿入することを意味する。
図６（Ｂ）の８行目の「/F10 10 Tf」は、現在のフォントを/F10、サイズを10に設定することを意味し、７行目に指示された文字列はこの設定で付加される。
図６（Ｂ）の９行目の「-149.2 3.3 Td (You must apply in person at any Social Secu-) Tj」は、相対座標（-149.2 3.3)に移動して文字列「You must apply in person at any Social Secu-」を挿入することを意味する。
図６（Ｂ）の１０，１１行目は、原画像にあるstringの英文として、「rity office. We will help you complete:」が８，９行目と同様に挿入される。

上記のように、挿入するレイヤーのレンダリングモードが、日本語の表示の際は可視色（例では緑）、英語の表示の際には無表示（=透明）の設定とする。
この設定で、原画像のレイヤーにある英文字に重ねて透明テキストを挿入し、この透明テキストを検索することによって、原画像の英文字画像(見かけ上)を検索できるようになる。これがサーチャブル（透明テキスト付き）ＰＤＦの原理である。
単語訳情報付きＰＤＦによる図６（Ａ）の表示例は、通常のサーチャブル（透明テキスト付き）ＰＤＦに加えて、単語訳が可視色で表示されたものである。
図６（Ａ）の表示例において、現在可視状態にある単語訳情報を不可視にしたければ、図６（Ｂ）の１行目に記述された「0 Tr」を「3 Tr」に変更すればよい。

ただ、サーチャブルＰＤＦのファイル全体の「0 Tr」を「3 Tr」に変更してしまうのは、危険である。というのは、単語訳情報の表示に利用しているレンダリングモードだけが「0 Tr」である保証はないので、他の可視表示情報があった場合には、ユーザーの意図に反して、全ての可視情報が無表示に変更されてしまう。
また、単語訳情報をもっと大きなサイズで表示したい場合やフォントの種類を変えるには、Tfオペレーションのオペランドを変更すれば実現できる。しかしながら、これもTfオペレーションが単語訳情報の表示用か、例えば原文テキストのような他の表示用かを区別できないので、必要な場合には、全てのTfオペレーションを変更するしかない。
つまり、既存のサーチャブルＰＤＦの記述例を示す図６（Ｂ）では、どの情報に関連するオペレーションなのかが記載されていないために情報ごとに表示モードを変更することができない。

そこで、この実施形態では、付加情報源ごとに利用目的や利用分野が異なり、付加情報の種類を付加情報源により分けることが適当であることを前提に、付加情報源ごとに挿入形態を指定できるようにすることで、ユーザーの要求に合う挿入形態の指示を、操作負担を大きくすることなく行えるようにすることを可能とし、上述の問題を解決する。
このための手段としては、サーチャブルＰＤＦの記述において、付加情報源でくくられる情報ごとに開始識別子「%」を挿入し、付加情報の種類が同じである範囲を限定する。
例えば、「%JpnInfo」は、日本語情報が開始することを意味し、「%EngInfo」は、英語情報が開始することを意味する。
なお、ＰＤＦ定義において行頭が、識別子「%」から始まる行はコメント行であり、ＰＤＦ解釈では無視され、ＰＤＦをもとに印刷や表示の画像出力に用いるデータを生成する処理を行う際には、出力用データには全く影響しない。

図７は、本実施形態に係る開始識別子「%」を挿入したサーチャブルＰＤＦの記述例を説明する図である。図７の記述例は、図６の表示例（Ａ）の挿入単語訳付きサーチャブルＰＤＦに開始識別子「%」を適用した例である。
サーチャブルＰＤＦの記述に「%JpnInfo」を適用した場合、%JpnInfo行から日本語情報に関するＰＤＦ定義が始まり、次に%EngInfo行が出現するまで続く。
同様に、%EngInfo行から英語情報に関するＰＤＦ定義が始まり、次に%JpnInfo行が出現するまで続く。
よって、図７の２行目の「0 Tr 0 1 0 rg」から６行目の「/F10 9 Tf」の和訳（日本語）情報に関するＰＤＦ定義の先頭行に日本語情報の開始を意味する「%JpnInfo」を記述し、図７の８行目の「3 Tr」から１２行目の「/F2 4.5 Tf」の英語情報に関するＰＤＦ定義の先頭行に英語情報の開始を意味する「%EngInfo」を記述する。

例えば、図7に示すような開始識別子「%」を適用したサーチャブルＰＤＦを表示する際に日本語情報の表示のみを変更したい場合、ＰＤＦ定義の最初から%JpnInfo行を検索し、%EngInfoが出現するまでの範囲において、オペレーションやオペランドを希望どおりに変更し、さらに%JpnInfo行が出現するまで読み飛ばして、%JpnInfo行が出現したら、同様の変更を行う、という処理を繰り返す。即ち、日本語情報という種類の付加情報だけをまとめて挿入形態を変更し作成したサーチャブルＰＤＦを用いることで、表示を変更することができる。

開始識別子「%」を挿入し、付加情報の種類を限定してサーチャブルＰＤＦの記述を変更する手法を用いる他の実施形態を説明する。
ここで示す実施形態は、付加情報の種類として難易度レベルの異なる言語に対応するものである。例えば、英語という同じ言語であっても、誰でも理解できるレベルから理解の困難なレベルという難易度レベルの違いがある。難易度レベルによって分類される言語の種類を限定してサーチャブルＰＤＦの記述を変更可能とする実施形態である。
図８は、本実施形態のサーチャブルＰＤＦの記述例を説明する図である。図８の記述例は、図７の記述例の%JpnInfoを難易度レベルで分類したものである。即ち、単語の難易度レベルごとに挿入形態を指定可能にして、ユーザーの要求に適応する付加情報の挿入を行うようにしたものである。

図８の記述例では、単語訳付きサーチャブルＰＤＦの付加情報源である英和辞書において、
・難易度レベル１：
訳語「適用する」に対応する英語“apply”
訳語「社会保障」に対応する英語“Social Security”
・難易度レベル２：
訳語「自分で」に対応する英語“in person”
と分類されている場合に、図８に示すように、そのレベル別に「%JpnInfo_LV1」、「%JpnInfo_LV2」という日本語情報の開始を意味する「%」行を設ける。このように設定する「%」行のもとに対象とする「適用する」、「社会保障」等の単語訳の日本語stringごとにオペレーションやオペランドの記述を変更、追加することで、各単語訳の挿入形態を指定することができる。
このように分類しておけば、英語初級者は全てのレベルの単語訳を利用し、英語上級者は高いレベルの単語訳のみ利用することができ、利用者の英語レベルに応じた付加情報を選択でき、ユーザーの要求に適応することができる。

上記のように、付加情報源の種類に対応する「%JpnInfo」、「%EngInfo」の記述により範囲を設定する方法により、設定範囲に属する付加情報に対して、挿入形態の指示が可能になる。
この方法によるサーチャブルＰＤＦの処理の手順は、先に述べたサーチャブルＰＤＦの作成処理における初期処理、即ち、図５のステップＳ１０１，Ｓ１０２で一旦ＰＤＦを作成する過程（全付加情報源から取得した付加情報をデフォルトの挿入形態で付加する作成過程）において、「%JpnInfo」、「%EngInfo」等の「%」行を当該ＰＤＦに記述し、付加情報の挿入形態を指示できる範囲を設定する。この後、この段階で作成されたサーチャブルＰＤＦに対して、図５のステップＳ１０３で説明したように、ユーザー操作によって付加情報源の種類ごとに行われる挿入形態の変更指示に応じて、サーチャブルＰＤＦの記述を変更する。

上記のユーザー操作は、表示装置５及び入力装置で構成するユーザーインターフェースを介して受付ける。例えば、「%JpnInfo_LV1」のもとにある日本語訳情報を表示させない、即ちレンダリングモードを透明にする対象日本語訳情報の挿入形態の変更を一括して指示する操作を受付けるユーザーインターフェースを用意し、難易度レベル２のみの表示を希望するユーザーの要求に応えるサーチャブルＰＤＦの記述に反映させる。
次いで、上記のユーザー操作に応じて、サーチャブルＰＤＦの記述を変更する処理を行い、ユーザーの指示に従い、変更されたサーチャブルＰＤＦを用いて画像出力を実行する。なお、サーチャブルＰＤＦの記述を変更する処理は、下記で図９の処理フローを参照して詳述する。

“サーチャブルＰＤＦの記述変更処理”
上記“サーチャブルＰＤＦの記述”で示した「%JpnInfo」、「%EngInfo」等の「%」行が記述されたサーチャブルＰＤＦの記述を変更する処理について説明する。
この処理は、全付加情報源から取得した付加情報をデフォルトの挿入形態で付加し、「%」行を加えて、一旦完成させたサーチャブルＰＤＦを、ユーザーインターフェースを介して指示された変更条件に応じて変更し、ユーザーが実行を求めるサーチャブルＰＤＦを作成する処理である。ここでは、変更条件が、付加情報源の種類に対応する変更対象と変更内容として指示され、指示された内容に従い変更対象を一括処理する。
図９は、この実施形態のサーチャブルＰＤＦの記述変更処理のフローを示す図である。
以下、図９を参照して、処理フローを説明する。

ユーザーインターフェースを介して、作成中のサーチャブルＰＤＦに対する記述変更を指示する入力が行われると、図９の処理フローに従う処理が開始され、先ず、ユーザーインターフェースを介して指定された、付加情報源の種類に対応する変更対象の情報種類と、その変更内容をＰＤＦの記述変更処理に必要な情報として受け取る（ステップＳ２０１）。ここに、変更対象の情報種類は、上述の例における「JpnInfo」、「EngInfo」等に当たり、変更内容は、ＰＤＦ定義内のオペレーションとオペランド（図６（Ｃ）、参照）で表現される。
次に、変更を加えようとする一旦完成させたサーチャブルＰＤＦを定義する記述を１行ずつ順に処理していくので、全行の処理を終えたかを否かを確認し（ステップＳ２０２）、ＰＤＦを定義する記述に未処理の行が確認できれば（ステップＳ２０２-YES）、処理を進行させる。
他方、ステップＳ２０２でＰＤＦを定義する記述全行の処理を終えたことが確認できれば（ステップＳ２０２-YES）、このフローの処理を終了する。

ＰＤＦの記述変更処理へ進んだ場合、先ずＰＤＦを定義する記述の処理順となる１行を処理の対象として読み込む（ステップＳ２０３）。
次いで、処理対象行が、開始識別子である「%」を先頭に付した%行（例えば、「%JpnInfo」、「%EngInfo」等）であるか否かを確認し（ステップＳ２０４）、その結果により処理手順を分岐する。
ここで、%行であることが確認できれば（ステップＳ２０４-YES）、次いで、当該処理対象行が、変更対象の行であるか否かを確認する（ステップＳ２０５）。この確認は、ユーザーが求める変更対象の行であるか否かを、ステップＳ２０１で受取った指定変更対象との一致／不一致の判断に従って行う。

この変更対象の確認ステップで、ユーザーが求める変更対象の行と一致せず、変更対象であることが確認できなければ（ステップＳ２０５-NO）、変更モードを「オフ」にする（ステップＳ２０６）。
他方、ユーザーが求める変更対象の行と一致し、変更対象であることが確認できれば（ステップＳ２０５-YES）、変更モードを「オン」にする（ステップＳ２０７）。なお、この変更モードの「オン」「オフ」は、後述するステップＳ２０８の手順を管理するために用いる。
変更モードの「オン」「オフ」を設定した後、次の順番の行に対する処理を行うために、ステップＳ２０２に戻り、ＰＤＦを定義する記述の次行に対する処理を前行で行ったステップＳ２０２〜Ｓ２０４の処理と同様に行う。

ステップＳ２０４で今回の処理対象行が、開始識別子である「%」を先頭に付した%行であることが確認できなければ（ステップＳ２０４-NO）、次いで、先にステップＳ２０６又はステップＳ２０７で操作した変更モードの「オン」「オフ」をもとに、現在の変更モードがオンであるか否かを確認する（ステップＳ２０８）。
ステップＳ２０８で現在の変更モードがオンであることが確認できれば（ステップＳ２０８-YES）、ステップＳ２０１で受取ったこの変更対象行に対して指示された変更内容に従って、ＰＤＦ定義内のオペレーションとオペランド（図６（Ｃ）、参照）を変更する（ステップＳ２０９）。
他方、ステップＳ２０８で現在の変更モードがオンであることが確認できなければ（ステップＳ２０８-NO）、変更対象行ではないので、何の処理もしないで、次の順番の行に対する処理を行うために、ステップＳ２０２に戻る。
なお、ステップＳ２０６で変更モードがオフになると、これ以降、変更モードがオンになるまでＰＤＦ定義は変更されず、読み飛ばされることになる。また、ステップＳ２０６で変更モードがオンになると、これ以降、変更モードがオフになるまでＰＤＦ定義はステップＳ２０１で受取った変更内容にしたがって変更される。

「挿入形態の変更例」
ユーザーが指示する付加情報の挿入形態の変更内容は、ＰＤＦ定義内のオペレーションとオペランド（図６（Ｃ）、参照）で表現される。
ユーザーが必要とする付加情報は、ユーザー個人によって異なるので、付加情報の情報源ごとに、Trオペレーションを用いてレンダリングモードを塗りつぶし／非表示にするオペレーションとオペランドを指示することで、付加情報の可視／不可視を選択できるようになり、ユーザー個人に適応した利用形態が実現できる。また、付加情報の可視／不可視を変更することは、付加レイヤーとしてのサーチャブルＰＤＦを利用した原文書の閲覧という側面からも有用性が増す。

さらに、付加情報の挿入に用いた文字の色と、原文書の背景が同じである場合、原文書のレイヤーに挿入する付加情報の視認性が悪くなるから、付加情報の挿入に用いる文字の色を、rgオペレーションを用いてレンダリングモードで塗りつぶす色のオペランド（rgb）を視認性が高くなる色に設定することにより、挿入した文字を見易くすることができる。また、小さい文字が見えにくいユーザーは、付加情報の挿入に用いる文字のサイズを、Tfオペレーションを用いてカレントフォントサイズのオペランド（size）を大きくする設定を行うことにより、見易い文字サイズで表示することができる。
その他、フォント種類など、文字の表示属性に関わる設定は、オペランドの変更で容易に実現できる。

「サーチャブルＰＤＦの応用」
サーチャブルＰＤＦの付加情報の利用形態としては、付加された透明テキストレイヤーの画像データを用い、そのデータに対するレンダリングモードを変更することにより原文画像の表示形態等を変更できるが、これだけでなく、付加情報としての透明テキストを取り出して、別アプリケーションにて利用したい場合もある。
例えば、単語訳情報付きＰＤＦから、原文テキストのみ取り出して、別のワープロソフトにて再利用したい場合等が想定される。

単にテキスト情報のみ取り出すことは、既存のサーチャブルＰＤＦにおいて、string（文字列型のデータ）を表示するTjオペレーションに注目して、そのオペランドを取り出すことによって実現できる。
ただ、既存のサーチャブルＰＤＦの場合、単語訳情報まで抽出されてしまい、取り出した後に余分な単語訳情報を削除する手間が生じてしまう。
ところが、この実施形態のサーチャブルＰＤＦによれば、付加情報源ごとに挿入形態を指定できる、即ちサーチャブルＰＤＦを定義しなおすことができることから、先の挿入形態（表示形態等）の変更と同様の方法によって、求める付加情報のみを取り出すＰＤＦに作り変えることができる。
具体的な処理の手順は、図９に示した処理フロー（ステップＳ２０６，Ｓ２０７，Ｓ２０８が関連する）における“変更モード”を“取り出しモード”と置き換えることによって、取り出したい付加情報部分（原文のテキストを含む）のみ、取り出す処理を行うことが可能になる。

「外部装置の利用」
本実施形態の情報処理装置は、図１に示した内蔵のＣＰＵ２の制御下で動作する外部デバイス１６を含む各種デバイスで構成することができるが、それぞれ独立に動作する情報処理装置で処理を分担する形態のシステム構成で実現することもできる。
図１０は、通信回線で互いに結ばれた情報処理装置を利用して本実施形態の情報処理装置を構成するシステムの構成例を示す図である。同図に示すシステムは、インターネットなどの通信回線３００を介して、情報処理装置１００_１，１００_２，１００_３が互いに接続されて構成する。情報処理装置１００_１，１００_２，１００_３は、図１に示した情報処理装置１００であっても良いが、上記したサーチャブルＰＤＦの処理に必要な機能の一部を有する装置でもよい。

例えば、原文書の画像データを上記サーチャブルＰＤＦの処理機能を有する外部の情報処理装置に依頼し、処理結果として得られるサーチャブルＰＤＦだけを利用するようにすれば、上記サーチャブルＰＤＦの処理機能を持たない情報処理装置でも、利益を享受できる。
また、例えば、各々の情報処理装置１００_１，１００_２，１００_３が有する付加情報源１４ｅとしての辞書データベース等が異なる場合、文書の種類によっては、外部の情報処理装置のデータベースを利用することにより適正な処理が可能になる。
また、情報処理装置１００_１，１００_２，１００_３の処理能力に違いがある場合には、能力の高い外部の情報処理装置を利用することにより、処理時間の短縮化が可能になる。

２・・ＣＰＵ、３・・メモリ、４・・通信装置、５・・表示装置、６・・ＨＤドライブ、７・・入力装置、１４，１４ｅ・・付加情報源、１５・・ＩＦ（インターフェース）、１６・・外部デバイス、１００・・情報処理装置。

特開平８−４４７３１号公報特開平４−２５６０６５号公報特開平６−２３１１１７号公報特開平６−４４２４３号公報特開２００４−２４６５００号公報

Claims

文書を担う原画像データのレイヤーに対し、別レイヤーの画像データとして前記文書の文書情報に対応付けて該文書情報と関連する付加情報を挿入してマルチレイヤー機能を有するファイルを作成する処理を行う情報処理装置であって、
前記文書情報と関連する複数の付加情報をそれぞれ該文書情報に対応付けて登録し、異なる種類のデータベースを構築する付加情報データベースと、
前記原画像データから文書情報を認識し、抽出される文書情報のうち前記付加情報を挿入する処理の対象となる文書情報を取得する文書情報取得部と、
前記文書情報取得部によって取得された文書情報に挿入する付加情報を前記付加情報データベースから取得する追加情報取得部と、
前記追加情報取得部によって取得された付加情報の挿入形態を付加情報データベースの種類ごとに指定する挿入形態指定部と、
前記挿入形態指定部によって指定された挿入形態に従い、原画像データのレイヤーに対し別レイヤーとして挿入する付加情報の画像データを生成する追加情報データ処理部と
を有し、
前記追加情報データ処理部は、挿入する付加情報に該付加情報が登録されたデータベースの識別情報を付記することを特徴とする情報処理装置。
請求項１に記載された情報処理装置において、
前記追加情報データ処理部は、処理の対象になる複数の文書情報に対し、同じ種類のデータベースに係る処理を一括して実施することを指定する処理の指示を受けて、指示に従う処理を行うことを特徴とする情報処理装置。
請求項２に記載された情報処理装置において、
前記指示に従う処理が、情報の可視／不可視を指定する挿入形態の処理であることを特徴とする情報処理装置。
請求項２に記載された情報処理装置において、
前記指示に従う処理が、文書情報に用いる文字情報の属性を指定する挿入形態の処理であることを特徴とする情報処理装置。
文書を担う原画像データのレイヤーに対し、別レイヤーの画像データとして前記文書の文書情報に対応付けて該文書情報と関連する付加情報を挿入してマルチレイヤー機能を有するファイルを作成する処理を行う情報処理装置であって、
前記文書情報と関連する複数の付加情報をそれぞれ該文書情報に対応付けて登録し、異なる種類のデータベースを構築する付加情報データベースと、
前記原画像データから文書情報を認識し、抽出される文書情報のうち前記付加情報を挿入する処理の対象となる文書情報を取得する文書情報取得部と、
前記文書情報取得部によって取得された文書情報に挿入する付加情報を前記付加情報データベースから取得する追加情報取得部と、
前記追加情報取得部によって取得された付加情報の挿入形態を付加情報データベースの種類ごとに指定する挿入形態指定部と、
前記挿入形態指定部によって指定された挿入形態に従い、原画像データのレイヤーに対し別レイヤーとして挿入する付加情報の画像データを生成する追加情報データ処理部と
を有し、
前記追加情報データ処理部は、処理の対象になる複数の文書情報に対し、同じ種類のデータベースに係る処理を一括して実施することを指定する処理の指示を受けて、指示に従う処理を行い、
前記指示に従う処理が、生成された別レイヤーとして挿入する付加情報の画像データから一部の付加情報の画像データを抽出し、外部へ取り出す処理であることを特徴とする情報処理装置。
請求項１乃至４のいずれかに記載された情報処理装置における情報処理方法であって、
前記文書情報と関連する複数の付加情報をそれぞれ該文書情報に対応付けて付加情報データベースに登録し、異なる種類のデータベースを構築する工程と、
前記原画像データから文書情報を認識し、抽出される文書情報のうち前記付加情報を挿入する処理の対象となる文書情報を取得する文書情報取得工程と、
前記文書情報取得工程で取得された文書情報に挿入する付加情報を前記付加情報データベースから取得する追加情報取得工程と、
前記追加情報取得工程で取得された付加情報の挿入形態を付加情報データベースの種類ごとに指定する挿入形態指定工程と、
前記挿入形態指定工程で指定された挿入形態に従い、原画像データのレイヤーに対し別レイヤーとして挿入する付加情報の画像データを生成する追加情報データ処理工程と、を有し、
前記追加情報データ処理工程では、挿入する付加情報に該付加情報が登録されたデータベースの識別情報を付記することを特徴とする情報処理方法。
請求項５に記載された情報処理装置における情報処理方法であって、
前記文書情報と関連する複数の付加情報をそれぞれ該文書情報に対応付けて付加情報データベースに登録し、異なる種類のデータベースを構築する工程と、
前記原画像データから文書情報を認識し、抽出される文書情報のうち前記付加情報を挿入する処理の対象となる文書情報を取得する文書情報取得工程と、
前記文書情報取得工程で取得された文書情報に挿入する付加情報を前記付加情報データベースから取得する追加情報取得工程と、
前記追加情報取得工程で取得された付加情報の挿入形態を付加情報データベースの種類ごとに指定する挿入形態指定工程と、
前記挿入形態指定工程で指定された挿入形態に従い、原画像データのレイヤーに対し別レイヤーとして挿入する付加情報の画像データを生成する追加情報データ処理工程と、を有し、
前記追加情報データ処理工程では、処理の対象になる複数の文書情報に対し、同じ種類のデータベースに係る処理を一括して実施することを指定する処理の指示を受けて、指示に従う処理を行い、
前記指示に従う処理が、生成された別レイヤーとして挿入する付加情報の画像データから一部の付加情報の画像データを抽出し、外部へ取り出す処理であることを特徴とする情報処理方法。