JP4574467B2 - データ処理装置、データ処理方法およびコンピュータプログラム - Google Patents

データ処理装置、データ処理方法およびコンピュータプログラム Download PDF

Info

Publication number
JP4574467B2
JP4574467B2 JP2005191539A JP2005191539A JP4574467B2 JP 4574467 B2 JP4574467 B2 JP 4574467B2 JP 2005191539 A JP2005191539 A JP 2005191539A JP 2005191539 A JP2005191539 A JP 2005191539A JP 4574467 B2 JP4574467 B2 JP 4574467B2
Authority
JP
Japan
Prior art keywords
objects
layout
external device
script
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005191539A
Other languages
English (en)
Other versions
JP2007013550A5 (ja
JP2007013550A (ja
Inventor
妙子 後藤
知俊 金津
北洋 金田
淳 藤沢
聡 今泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005191539A priority Critical patent/JP4574467B2/ja
Priority to US11/433,034 priority patent/US7853873B2/en
Publication of JP2007013550A publication Critical patent/JP2007013550A/ja
Publication of JP2007013550A5 publication Critical patent/JP2007013550A5/ja
Application granted granted Critical
Publication of JP4574467B2 publication Critical patent/JP4574467B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Description

本発明は、紙文書を電子化して電子データを生成するためのデータ処理装置、データ処理方法およびコンピュータプログラムに関する。
近年、環境問題によるペーパレス化や、オフィスの省スペース化を目的に、紙文書をスキャンして電子データ化しておき、閲覧する際はPCのモニタ上で閲覧するケースが増えてきた。
この電子データの中からユーザが見たい情報を拡大して表示したい場合、ユーザはPCにインストールされた編集ツールを使うケースが考えられる。しかしながら、編集ツールで拡大した場合、電子文書の一部分を拡大するので、文章が途中で途切れ文意を読み取りにくい場合がある。
また、特許文献1では文書をスキャンし行単位で文字を切り出し、表示画面で見やすいように行単位で結合、拡大、縮小等の処理を行っている。
また、特許文献2では文書をスキャンして文字・線図形・画像に領域分割した後、文字優先モード・線図形優先モード・画像優先モードの選択に応じて各属性の領域に変倍処理を実行し、レイアウトして印刷することが開示されている。
また、一方、特許文献3では、紙文書を電子化し、コンテンツ情報(オブジェクト情報)を生成し、コンテンツ単位の情報を登録・管理する技術が記載されている。特許文献3では、電子化文書を処理する文書処理装置において、電子化文書作成部は画像データに対してレイアウト解析を行って所定の属性の領域に分割し、分割された領域毎のコンテンツを登録しておく。該コンテンツを再利用する際は、一覧表示したコンテンツの中から、所望のコンテンツを取り出して利用できるようにする。
特開2000−163044号公報 特開2002−165079号公報 特開2002−073598号公報
一般的に、画像データの編集ツールでは、単純に拡大しただけだと、文章が途中で途切れ文意を読み取りにくい場合があり、また、所望の画像を得ようとするならば複雑な操作が必要とされる。また編集ツール自体が高額であるためどのPCにもインストールされているとは限らない。
特許文献1は文字領域をラスタ画像のまま拡大/縮小処理しているので、見たい部分の画像が劣化する場合がある。
特許文献2では、文字、写真などの属性単位でしか拡大できない。例えば、複数の写真が記載されている文書データのおいて、その中の一枚の写真だけを拡大することはできない。また、データ入力時に元の画像を変倍レイアウト処理して出力しているので、その出力された文書と元の文書との相関がとりにくい。また、印刷することを前提としているので、データの再利用性が低い。
特許文献3では、所望の文書を得ようとすると、コンテンツを一覧表示させ、その中から必要なコンテンツをユーザが選択してレイアウトする必要があり、手間がかかる。
上記課題を解決するために、本発明のデータ処理装置は、入力されたオリジナルの原画像を属性ごとの複数の領域に分割し、当該分割された複数の領域それぞれをオブジェクトとして、複数のオブジェクトを再生表示するための情報を抽出するオブジェクト抽出手段と、当該抽出された複数のオブジェクトを再生表示するための情報と前記複数のオブジェクトのレイアウトを変更させるためのスクリプトを含むレイアウト制御情報とを統合することにより、統合電子データを生成する統合手段と、当該生成された統合電子データを外部装置に送信する出力手段とを有し、前記レイアウト制御情報に含まれるスクリプトは、前記外部装置により実行されたとき、前記オブジェクトを再生表示するための情報を用いて前記複数のオブジェクトをオリジナルのレイアウトで再生表示し、当該再生表示された複数のオブジェクトの中から当該外部装置のユーザに拡大対象とするオブジェクトを選択させ、当該外部装置のユーザにより選択されたオブジェクトが拡大されるように前記複数のオブジェクトそれぞれの拡大、縮小、配置を行うことにより、前記複数のオブジェクトのレイアウトを変更する装置として当該外部装置を機能させるためのスクリプトであることを特徴とする。
また、上記課題を解決するために、本発明のデータ処理方法は、抽出手段が、入力されたオリジナルの原画像を属性ごとの複数の領域に分割し、当該分割された複数の領域それぞれをオブジェクトとして、複数のオブジェクトを再生表示するための情報を抽出するオブジェクト抽出ステップと、統合手段が、当該抽出された複数のオブジェクトを再生表示するための情報と前記複数のオブジェクトのレイアウトを変更させるためのスクリプトを含むレイアウト制御情報とを統合することにより、統合電子データを生成する統合ステップと、出力手段が、当該生成された統合電子データを外部装置に送信する出力ステップとを有し、前記レイアウト制御情報に含まれるスクリプトは、前記外部装置により実行されたとき、前記オブジェクトを再生表示するための情報を用いて前記複数のオブジェクトをオリジナルのレイアウトで再生表示し、当該再生表示された複数のオブジェクトの中から当該外部装置のユーザに拡大対象とするオブジェクトを選択させ、当該外部装置のユーザにより選択されたオブジェクトが拡大されるように前記複数のオブジェクトそれぞれの拡大、縮小、配置を行うことにより、前記複数のオブジェクトのレイアウトを変更する装置として当該外部装置を機能させるためのスクリプトであることを特徴とする。
また、上記課題を解決するために、本発明のコンピュータプログラムは、コンピュータ、入力されたオリジナルの原画像を属性ごとの複数の領域に分割し、当該分割された複数の領域それぞれをオブジェクトとして、複数のオブジェクトを再生表示するための情報を抽出するオブジェクト抽出手段、当該抽出された複数のオブジェクトを再生表示するための情報と前記複数のオブジェクトのレイアウトを変更させるためのレイアウト制御情報とを統合することにより、統合電子データを生成する統合手段、当該生成された統合電子データを外部装置に送信する出力手段、として機能させるためのコンピュータプログラムであって、前記レイアウト制御情報に含まれるスクリプトは、前記外部装置により実行されたとき、前記オブジェクトを再生表示するための情報を用いて前記複数のオブジェクトをオリジナルのレイアウトで再生表示し、当該再生表示された複数のオブジェクトの中から当該外部装置のユーザに拡大対象とするオブジェクトを選択させ、当該外部装置のユーザにより選択されたオブジェクトが拡大されるように前記複数のオブジェクトそれぞれの拡大、縮小、配置を行うことにより、前記複数のオブジェクトのレイアウトを変更する装置として当該外部装置を機能させるためのスクリプトであることを特徴とする
本発明では、もともとの紙文書の体裁を保ったまま電子化したオブジェクト情報(画像情報)に、データ変換やレイアウト設定するためのスクリプト情報を付加した統合電子データが生成される。
データの変換処理はユーザが使用する際に実行されるので、ユーザ自身が画像編集専用のアプリケーションを用いて複雑な操作を行わなくても、ユーザが見たい情報を簡単に拡大するなどの変換を行える。
拡大変換などの処理を施した後のデータを出力するのではなく、データ使用時に変換処理を行うので、画像入力時のデータ処理の負荷が小さくて済む。更に、1つの電子データで、複数種類のレイアウトを提示できるようになる。
オリジナルの文書画像の体裁も保持し、そこからユーザの簡単な指示に応じて、画像変換等を行うので元の紙文書との相関が取りやすく、またデータ自体の再利用性も高い。
拡大オブジェクトの選択は、データ使用時にユーザが細かく指示できるので、ユーザの意図に合ったデータ提示が可能になる。
(実施例1)
以下、図面を参照して本発明の好適な実施例を詳細に説明する。本実施例の説明は、(1)システム構成、(2)電子データ生成時の処理、(3)電子データ使用時の処理の順で説明をする。
<<(1)システム構成>>
図1は本発明を実施するためのシステム構成を示す図である。
101は画像入力デバイス、102は電子データ制御デバイス、103はLANやインターネットを構成するネットワークインターフェースである。
101は本実施例ではイメージスキャナを想定している。なお、本実施例では、画像入力デバイス101としてイメージスキャナを例としてあげたが、複合機やデジタルカメラなど、その他の画像入力デバイスであってもよいし、複数の機器で構成されるシステムであってもよい。
101の内部には、レイアウト制御プログラム(以下、本実施例では「スクリプト」と称す)を生成するスクリプト生成部104が内蔵されている。104で実行される処理の詳細は後述する。なお、本実施例では104は専用のハードウエアで構成されているものとするが、ソフトウエア的に実現してもよい。ソフトウエア的に実現する場合、画像入力デバイス101に内蔵されているコンピュータ(CPU)が、本発明を構成するためのプログラムコードを含むコンピュータプログラムを実行することにより実現される。なお、コンピュータプログラムはハードディスクなどの内部記憶媒体に格納されていてもよいし、CD−ROM等の取り外し可能な記憶媒体から読み込んで実行するようにしてもよい。
102は本実施例では汎用的なパーソナルコンピュータ(PC)を想定しているが、PDA、携帯端末などであってもよい。102には電子データ処理部105が内蔵されている。105はスクリプトを処理するためのアプリケーションプログラムを102にインストールすることで実現されるものとする。コンピュータ102は、該アプリケーションを格納した記憶媒体やネットワークを介してこのアプリケーションプログラムを取得しインストールを実行する。なお、本実施例では電子データ処理部105をソフトウエア的に実現しているが、専用のハードウエアによって実現するものであってもよい。105の内部詳細は後述する。
103は、複数のスキャナ101およびPC102や図示しない遠隔地に存在する装置が互いに通信し、プログラムやデータなどを読み込んだり、書き込んだりする際に用いられるネットワークである。
<<(2)電子データ生成時の処理>>
画像入力デバイス101およびスクリプト生成部104を用いて紙文書から本発明のスクリプト付き電子データ(スクリプト付き画像データ)を生成する処理を、図2のフローチャートを用いて説明する。
ステップS201では、入力された紙文書を画像入力デバイス101で読み取って電子データ化(画像データ化)する。例えば、紙文書を読み取って図3の301で示すような画像を得たとする。
ステップS202では、読み取った画像を属性ごとの領域に分割する。本実施例における属性とは、文字、写真、線画、表を指す。この領域分割処理としては、米国特許5680478に記載の領域分割処理などを用いることができる。例えば、文書画像中の黒画素塊、白画素塊の集合が抽出され、その形状、大きさ、集合状態等から、文字、絵や図、表、枠、線といった属性別の領域が抽出される。図4は、文書画像301を各属性の領域に領域分割した結果を、各領域を囲む矩形を用いて示す。矩形領域401,404,406,407の属性は文字である。矩形領域402,403の属性は写真である。矩形領域405の属性は表である。なお、領域分割の手法は上記例に限るものではなく、その他の手法を用いても構わない。
ステップS203では、ステップS202で分割された領域からオブジェクト情報を生成する。つまり、文書画像を分割して得られた各領域をオブジェクトとして抽出することになる。オブジェクト情報には、当該オブジェクトの属性情報と、オリジナルのレイアウト情報と、視覚情報などが含まれる。
ここで、レイアウト情報とは、分割された各オブジェクト領域の幅、高さ、ページ全体での位置などのレイアウトに関する情報を含む。また、他のオブジェクトとの前後の順序の情報を持つ。
視覚情報とは、紙文書の電子データからレイアウト情報を用いて抽出したラスタ画像や、ラスタ画像を元に変換処理したベクタグラフィックス、分割された領域の属性が文字であれば文字認識した結果のテキスト情報・フォント情報など、オブジェクトの表示に関する情報(オブジェクトの再生に関する情報)である。好適には、属性ごとに適切な視覚情報が選択されることになる。例えば、写真の領域はラスタ画像、線画の領域はベクタグラフィックス、文字領域は文字認識結果の情報(あるいは文字認識精度が良くない場合はベクタグラフィックス)、などとする。
ステップS204では、レイアウト制御情報を生成する。レイアウト制御情報の生成については後述する。
ステップS205では、生成したオブジェクト情報とレイアウト制御情報とを統合し、電子データを作成する。
ステップS206では、ステップS205で統合して作成された電子データを、ネットワーク103を介して、電子データ制御デバイス102に出力する。
次に、ステップS204のレイアウト制御情報について、詳細を説明する。レイアウト制御情報には、オブジェクトの拡大・縮小を制御するためのスクリプト(制御プログラム)が含まれる。また、各オブジェクトの配置を変更するスクリプト(制御プログラム)も含まれる。
レイアウト制御情報には、(A)テンプレートとオブジェクトの数に基づいてレイアウトを決定するスクリプト、(B)ページレイアウト(配置領域)のサイズにあわせてオブジェクトの変倍率を決定するスクリプト、(C)スクリプトBで決定した変倍率でオブジェクトを変換するスクリプト、(D)スクリプトCで変倍されたオブジェクトをページレイアウトにあわせて移動させるスクリプト、の4つが含まれる
スクリプト(A)について図5、図6を用いて説明する。
オブジェクトの大まかな配置領域をテンプレートとして用意しておく。図5(A)はテンプレートの例である。501は拡大対象オブジェクトの配置領域、502は拡大対象ではないオブジェクトの配置領域とする。同じように、図5(B)〜(D)の504,505,508は拡大対象オブジェクトの配置領域、503,506,507は拡大対象でないオブジェクトの配置領域である。本実施例では、文書画像を読み込む前に、テンプレートのうちのひとつを予めユーザが選択しておくものとする。なお、テンプレートの種類はこれに限るものではなく、他のテンプレートをユーザがつくってもよい。
次に、スクリプト(A)を電子データ制御デバイス102が実行した場合に行われる処理について、図6のフローチャートに基づいて説明する。
ステップS601では、電子データに含まれるオブジェクト数Xを取得する。ここでは、図2のステップS202で領域分割したオブジェクトの総計が取得されることになる。
ステップS602では、オリジナルのレイアウトで画像を表示させて、ユーザに拡大対象とするオブジェクトを選択させた際に、当該選択された拡大対象オブジェクトの数Nを取得する。
ステップS603では、予め選んでおいたテンプレートの拡大対象オブジェクト配置領域をN分割する。
ステップS604では、該テンプレートの縮小オブジェクト配置領域を(X−N)分割する。
なお、ステップS603やS604における配置領域の分割手順は、各テンプレートに対して予め定義されているものとする。この定義は、各オブジェクトを見やすいように分割していくルールになっていることが望ましい。
このように、スクリプト付き電子データが画像入力デバイス101から電子データ制御デバイス102に送信され、当該電子データ制御デバイス102で電子データ内のスクリプトが実行されると、ユーザは所望の拡大対象オブジェクトを選択するだけで、ステップS602で拡大対象オブジェクトの数が確定され、その後、ステップS603〜604で配置領域が決定される。
次に、スクリプト(B)を電子データ制御デバイス102が実行した場合に行われる処理について、図7、8を用いて説明する。スクリプト(B)では、図6で生成した各オブジェクト配置領域内に、各オブジェクトをレイアウトするため、オブジェクト毎に変倍率を求める処理が実行される。
変倍率の求め方はオブジェクトの属性によって異なる。具体的に言うと、オブジェクトの属性が写真、線画、表である場合はオブジェクトのアスペクト比を保った状態で変倍し、オブジェクトの属性が文字ならば、一文字単位で大きさを変倍し、配置領域に文字を再配置すればよい。
オブジェクトのアスペクト比を保持する場合の変倍率の求め方を図7に示す。
ステップS701では、配置領域の幅Wと高さHとを取得する。なお、配置領域とは、変倍率を求めるオブジェクトが拡大対象オブジェクトである場合は図6のS603拡大対象オブジェクト配置領域であり、一方、変倍率を求めるオブジェクトが拡大対象でないオブジェクトである場合は縮小オブジェクト配置領域である。
ステップS702では、当該変倍率を求めるオブジェクト固有の幅wと高さhを取得する。
ステップS703では、(H/h)≦(W/w)であるか判断し、そうであれば、ステップS704へ移行する。一方、(H/h)≦(W/w)でなければ、ステップS705へ移行する。
ステップS704では、変倍率αを(格納領域の高さH/オブジェクトの高さh)で算出する。
ステップS705では、変倍率αを(格納領域の幅W/オブジェクトの幅w)で算出する。
以上の図7の各ステップを、属性が写真、線画、表であるオブジェクトに対して実施し、オブジェクトごとの変倍率を算出する。
次に、アスペクト比を考慮しなくてよい場合(オブジェクトが文字領域である場合)の変倍率の求め方を図8に示す。
ステップS801では、配置領域の幅と高さに基づいて面積Sを取得する。なお、配置領域とは、変倍率を求めるオブジェクトが拡大対象オブジェクトである場合は図6のS603拡大対象オブジェクト配置領域であり、一方、変倍率を求めるオブジェクトが拡大対象でないオブジェクトである場合は縮小オブジェクト配置領域である。
ステップS802では、文字領域オブジェクトの幅、高さからオブジェクトの面積s’を取得する。
ステップS803では、変倍率β=√(S/s’)を算出する。
以上の図8の各ステップを、属性が文字であるオブジェクトに対して実施し、オブジェクトごとの変倍率を算出する。
次にスクリプト(C)を電子データ制御デバイス102が実行した場合に行われる処理について、図9を用いて説明する。
スクリプト(C)が実行されると、スクリプト(B)の処理によって算出された変倍率に基づいて、各オブジェクトの変換処理が行われる。
変換処理の方法はオブジェクトの属性によって異なる。具体的に言うと、オブジェクトの属性が写真、線画、表の場合は、図7で求めた変倍率に基づいてアスペクト比を保持した線形変倍が行われ、オブジェクトの属性が文字の場合は、図8で求めた変倍率に基づいて文字ごとに変倍が行われ、更に配置領域の形状に合わせて変倍された各文字オブジェクトを配置する。
図9の901は、線形変倍前のオブジェクトであり、902は線形変倍後のオブジェクトである。図9の903は文字サイズ変倍前の文字オブジェクトであり、904は各文字のサイズを変倍後、格納領域の形状に合わせて再配置した文字オブジェクトである。
スクリプト(D)が実行されると、スクリプト(C)により変倍処理されたオブジェクトを、スクリプト(A)により決定された各配置領域の位置(レイアウト)にあわせて座標情報(位置情報)を変換する処理が行われる。
以上述べたような処理を行うためのスクリプト(A)〜(D)が、スクリプト生成部104で生成されて画像データに付加される。
<<(3)データ利用時の処理>>
画像入力デバイス101およびスクリプト生成部104により生成されたスクリプト付き電子データを、電子データ制御デバイス102内の電子データ処理部105が利用する場合の処理を図10のフローチャートに基づいて説明する。
ステップS1001では、電子データに含まれるオリジナルのレイアウトに基づいてオリジナル画像を再生し、拡大対象オブジェクトを指定するコマンドを、ユーザに入力させる。コマンド入力では、表示された電子データの拡大対象となる領域を、汎用的なパーソナルコンピュータに備えられたキーボード、ポインティングデバイスなどの入力デバイスで指定する。例えば、拡大対象オブジェクトの指定はポインティングデバイスで任意領域を囲う動作や、ポインティングデバイスで指し示す動作などで決定しても良い。
拡大対象オブジェクトの選択が終了(動作実行ボタンを指定したり、ポインティングデバイスのダブルクリックなどで選択終了を検知する)すると、オブジェクト拡大の一連の処理が開始される。
本実施例では、図4の文書画像に含まれるオブジェクトのうち、表オブジェクト405と文字オブジェクト406の合計2つを拡大対象オブジェクトとユーザにより指定された場合を例として述べる。
ステップS1002では、当該電子データに含まれるスクリプト(図2のS204で生成されたレイアウト制御情報)を呼び出す。
ステップS1003では、各スクリプトを実行する。
まず、図6を用いて説明したような、テンプレートとオブジェクトの数に基づいてレイアウトを決定するスクリプト(A)が実行される。
本実施例では、予めテンプレートとして図5の(A)が選択されていたものとする。この場合、図4の電子データがもつオブジェクト数X=7、拡大するオブジェクトN=2であるので、図13のような配置領域のレイアウトが生成される。ここで、501_1,501_2は拡大対象オブジェクト配置領域、502_1,502_2,502_3,502_4,502_5は拡大対象ではないオブジェクトの配置領域となる。
次に、図7や図8を用いて説明したように、各オブジェクトに対して、オブジェクトの変倍率を決定するスクリプト(B)が実行される。
上述した例では、図4の405、406は、図13の拡大対象オブジェクト配置領域に、図4の401、402、403、404、407は拡大対象領域でないオブジェクトの配置領域にあわせて変倍率を算出する。図4の402、403、405は写真領域や表領域であるので、図7で示したように、アスペクト比を保持した変倍率を求めることになる。一方、図4の401,404,405,406,407は、文字領域であるので、図8で示したように変倍率が算出される。
続いて、求めた変倍率に基づいてオブジェクトを変換処理するスクリプト(C)が実行される。
上述した例では、図4の402、403、405はアスペクト比を保持した線形変倍、図4の401,404,405,406,407は文字領域であるので文字サイズを変倍し格納領域の形状にあわせて文字の再配置を行う。
最後に、スクリプト(D)を実行し、変倍処理したオブジェクトを各配置領域の位置(レイアウト)にあわせて、オブジェクトの座標情報(位置情報)の変換処理を実行する。
ステップS1004では、変換処理されたオブジェクトを電子データ制御デバイス102で表示する。上述した例で、変換処理されたオブジェクトは、図11のように表示される。
このように、オリジナルのレイアウトで表示された画像上から、簡便な操作で、拡大したいオブジェクトを選択するだけで、簡単にレイアウトを変更できるようになる。
例えば図4のようなパンフレットの場合、小さな文字の部分を拡大して読みたい場合など、ユーザの興味に応じて簡単に所望のオブジェクトを拡大することが可能になる。
(実施例2)
実施例1では全てのオブジェクトに対して変倍処理を行うスクリプトを実行していたが、拡大対象以外のオブジェクトのもともとのサイズ(幅と高さ)が、配置領域内に収まる場合は、変倍処理をせず座標情報のみを変換してレイアウトに適応させてもよい。この場合、変倍処理回数が減るので実施例1と比較してデータ利用時の処理が高速に行える。
(実施例3)
また、電子データに付与するスクリプトは実施例1で記載したスクリプトに限るものではなく、例えば次のような処理を行うためのスクリプトであってもよい。
実施例1では、あるオブジェクトを拡大しても他のオブジェクトはすべて閲覧できるように、オブジェクトの配置位置を変換していたが、拡大対象オブジェクトだけに対して変倍・移動の処理を行ってもよい。
例えば、拡大対象オブジェクトとして図4の407を選択すると、図12のようにオブジェクト407だけ拡大される。ここでは、他のオブジェクト401〜406は変倍や配置移動はされておらず、407のみ拡大処理のスクリプトを実行し表示している。なお、拡大率は原稿画像の縦あるいは横方向の長さに当該オブジェクトが収まるように決定すればよい。
拡大対象オブジェクト以外の変換処理を行わないので、実施例1と比較してデータ利用時に処理が高速に行えるようになる。
(実施例4)
実施例1では、電子データ制御デバイス102にアプリケーションをインストールすることにより、電子データに含まれるスクリプトを実行できるようにしたが、この形態に限るものではない。例えば、予め電子データ制御デバイス102が解釈可能なフォーマットを用いて、スクリプトを格納した電子データを記述すれば、アプリケーションのインストールがされていなくても本発明を実現可能となる。
例えば、PDFなどの汎用フォーマットを利用して、スクリプトとオブジェクト情報とを格納し、当該スクリプトを解釈して実行できるような形態でもよい。
また、実施例1では、画像入力デバイス101においてスクリプト付き電子データが生成され、電子データ制御デバイス102において当該電子データが受信されて実行されるものとしたが、この形態に限るものではない。例えば、画像入力デバイス101において当該電子データの生成とスクリプトの実行を行うようにしても構わない。その場合は画像入力デバイス101上の表示画面を介してユーザからの指示を受けることになる。
(実施例5)
実施例1では、オブジェクト情報とレイアウト制御情報(スクリプト)とを統合することによって、電子データを生成していたが、本実施例では更にオリジナルの文書画像も一緒に統合するようにしても構わない。その場合、当該生成されたスクリプト付き電子データを使用するとき、ステップS1001などでオリジナルを表示する際に、当該統合されているオリジナル文書画像を利用して再生するようにしてもよい。
本発明のシステム構成例 電子データ生成に係るフローチャート 読み取られた文書画像の例 文書画像を領域分割した結果 テンプレートの例 配置レイアウトを決定する際のスクリプト(A)によるフローチャート アスペクト比を保持する場合のスクリプト(B)によるフローチャート アスペクト比を保持しない場合のスクリプト(B)によるフローチャート オブジェクトを変倍する際のスクリプト(C)によるフローチャート スクリプト付き電子データを使用する際のフローチャート オブジェクトの変倍処理を行って配置した結果の例 実施例3における指定したオブジェクトの変倍処理を行った際の例 X=7,N=2の場合の配置領域レイアウト例

Claims (10)

  1. 入力されたオリジナルの原画像を属性ごとの複数の領域に分割し、当該分割された複数の領域それぞれをオブジェクトとして、複数のオブジェクトを再生表示するための情報を抽出するオブジェクト抽出手段と、
    当該抽出された複数のオブジェクトを再生表示するための情報と前記複数のオブジェクトのレイアウトを変更させるためのスクリプトを含むレイアウト制御情報とを統合することにより、統合電子データを生成する統合手段と、
    当該生成された統合電子データを外部装置に送信する出力手段と
    を有し、
    前記レイアウト制御情報に含まれるスクリプトは、前記外部装置により実行されたとき、前記オブジェクトを再生表示するための情報を用いて前記複数のオブジェクトをオリジナルのレイアウトで再生表示し、当該再生表示された複数のオブジェクトの中から当該外部装置のユーザに拡大対象とするオブジェクトを選択させ、当該外部装置のユーザにより選択されたオブジェクトが拡大されるように前記複数のオブジェクトそれぞれの拡大、縮小、配置を行うことにより、前記複数のオブジェクトのレイアウトを変更する装置として当該外部装置を機能させるためのスクリプトであることを特徴とするデータ処理装置。
  2. 前記オブジェクトを再生表示するための情報には、当該オブジェクトの属性情報と、前記オリジナルのレイアウトに関する情報と、視覚情報とが含まれることを特徴とする請求項1に記載のデータ処理装置。
  3. 前記視覚情報は、ラスタ画像、ベクタグラフィックス、文字認識結果情報を用いて、各オブジェクトを再生表示するための情報であることを特徴とする請求項に記載のデータ処理装置。
  4. 前記レイアウト制御情報に含まれるスクリプトは、前記外部装置のユーザにより選択されたオブジェクトが拡大されるように前記複数のオブジェクトそれぞれの拡大、縮小、配置を行う際に、テンプレートレイアウトに基づいて前記複数のオブジェクトのレイアウトを変更する装置として当該外部装置を機能させるためのスクリプトであることを特徴とする請求項1乃至のいずれかに記載のデータ処理装置。
  5. 前記テンプレートレイアウトは拡大対象オブジェクト配置領域と非拡大対象オブジェクト配置領域とによって構成されるものであって、
    前記レイアウト制御情報に含まれるスクリプトは、前記外部装置のユーザによって前記拡大対象として選択されたオブジェクトの数と選択されなかったオブジェクトの数とに基づいて前記拡大対象オブジェクト配置領域と前記非拡大対象オブジェクト配置領域のそれぞれを分割し、当該分割された拡大対象オブジェクト配置領域配置領域に前記拡大対象として選択されたオブジェクトを拡大して配置し、当該分割された非拡大対象オブジェクト配置領域に前記拡大対象として選択されなかったオブジェクトを縮小して配置する装置として当該外部装置を機能させるためのスクリプトであることを特徴とする請求項に記載のデータ処理装置。
  6. 前記統合手段は、前記オブジェクトに関する情報と前記レイアウト制御情報と前記入力された原画像とを統合することにより、統合電子データを生成し、
    前記レイアウト制御情報に含まれるスクリプトは、前記外部装置により実行されたとき、当該統合されている原画像を表示し、当該表示された原画像において当該外部装置のユーザに拡大対象とするオブジェクトを選択させ、当該外部装置のユーザにより選択されたオブジェクトが拡大されるように前記複数のオブジェクトそれぞれの拡大、縮小、配置を行うことにより、前記複数のオブジェクトのレイアウトを変更する装置として当該外部装置を機能させるためのスクリプトであることを特徴とする請求項1に記載のデータ処理装置。
  7. 文書を読み取ることにより読取画像を生成する読取手段を更に有するデータ処理装置であって、
    前記入力された画像は、前記読取手段で読み取られた読取画像であることを特徴とする請求項1に記載のデータ処理装置。
  8. 抽出手段が、入力されたオリジナルの原画像を属性ごとの複数の領域に分割し、当該分割された複数の領域それぞれをオブジェクトとして、複数のオブジェクトを再生表示するための情報を抽出するオブジェクト抽出ステップと、
    統合手段が、当該抽出された複数のオブジェクトを再生表示するための情報と前記複数のオブジェクトのレイアウトを変更させるためのスクリプトを含むレイアウト制御情報とを統合することにより、統合電子データを生成する統合ステップと、
    出力手段が、当該生成された統合電子データを外部装置に送信する出力ステップと
    を有し、
    前記レイアウト制御情報に含まれるスクリプトは、前記外部装置により実行されたとき、前記オブジェクトを再生表示するための情報を用いて前記複数のオブジェクトをオリジナルのレイアウトで再生表示し、当該再生表示された複数のオブジェクトの中から当該外部装置のユーザに拡大対象とするオブジェクトを選択させ、当該外部装置のユーザにより選択されたオブジェクトが拡大されるように前記複数のオブジェクトそれぞれの拡大、縮小、配置を行うことにより、前記複数のオブジェクトのレイアウトを変更する装置として当該外部装置を機能させるためのスクリプトであることを特徴とするデータ処理方法。
  9. コンピュータ
    入力されたオリジナルの原画像を属性ごとの複数の領域に分割し、当該分割された複数の領域それぞれをオブジェクトとして、複数のオブジェクトを再生表示するための情報を抽出するオブジェクト抽出手段
    当該抽出された複数のオブジェクトを再生表示するための情報と前記複数のオブジェクトのレイアウトを変更させるためのレイアウト制御情報とを統合することにより、統合電子データを生成する統合手段
    当該生成された統合電子データを外部装置に送信する出力手段、
    として機能させるためのコンピュータプログラムであって、
    前記レイアウト制御情報に含まれるスクリプトは、前記外部装置により実行されたとき、前記オブジェクトを再生表示するための情報を用いて前記複数のオブジェクトをオリジナルのレイアウトで再生表示し、当該再生表示された複数のオブジェクトの中から当該外部装置のユーザに拡大対象とするオブジェクトを選択させ、当該外部装置のユーザにより選択されたオブジェクトが拡大されるように前記複数のオブジェクトそれぞれの拡大、縮小、配置を行うことにより、前記複数のオブジェクトのレイアウトを変更する装置として当該外部装置を機能させるためのスクリプトであることを特徴とする、コンピュータプログラム
  10. 請求項に記載のコンピュータプログラムを格納した、コンピュータ読取可能な記憶媒体。
JP2005191539A 2005-06-30 2005-06-30 データ処理装置、データ処理方法およびコンピュータプログラム Expired - Fee Related JP4574467B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005191539A JP4574467B2 (ja) 2005-06-30 2005-06-30 データ処理装置、データ処理方法およびコンピュータプログラム
US11/433,034 US7853873B2 (en) 2005-06-30 2006-05-12 Data processing apparatus, data processing method, and computer program for generating electronic data from a paper document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005191539A JP4574467B2 (ja) 2005-06-30 2005-06-30 データ処理装置、データ処理方法およびコンピュータプログラム

Publications (3)

Publication Number Publication Date
JP2007013550A JP2007013550A (ja) 2007-01-18
JP2007013550A5 JP2007013550A5 (ja) 2008-08-14
JP4574467B2 true JP4574467B2 (ja) 2010-11-04

Family

ID=37589596

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005191539A Expired - Fee Related JP4574467B2 (ja) 2005-06-30 2005-06-30 データ処理装置、データ処理方法およびコンピュータプログラム

Country Status (2)

Country Link
US (1) US7853873B2 (ja)
JP (1) JP4574467B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4738943B2 (ja) * 2005-09-01 2011-08-03 キヤノン株式会社 画像処理装置およびその方法
US20100254606A1 (en) * 2005-12-08 2010-10-07 Abbyy Software Ltd Method of recognizing text information from a vector/raster image
JP2007299321A (ja) * 2006-05-02 2007-11-15 Ricoh Co Ltd 情報処理装置、情報処理方法、情報処理プログラム、及び、情報記憶媒体
US20080165390A1 (en) * 2007-01-08 2008-07-10 Samsung Electronics Co., Ltd. Image forming device and method to adjust images in document to be printed
AU2007201652B2 (en) 2007-04-13 2010-09-02 Canon Kabushiki Kaisha Laying out graphical elements on a page
JP4997070B2 (ja) * 2007-10-31 2012-08-08 京セラドキュメントソリューションズ株式会社 電気機器、画像表示制御方法、及び、画像表示制御プログラム
JP5159588B2 (ja) * 2008-12-05 2013-03-06 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP5141984B2 (ja) * 2009-05-11 2013-02-13 ソニー株式会社 情報処理装置および方法
US9489121B2 (en) 2011-11-02 2016-11-08 Microsoft Technology Licensing, Llc Optimal display and zoom of objects and text in a document
JP5984439B2 (ja) * 2012-03-12 2016-09-06 キヤノン株式会社 画像表示装置、画像表示方法
CN103679632A (zh) * 2012-09-18 2014-03-26 英业达科技有限公司 以不同缩放比例缩放影像中不同区域的系统及方法
US9008425B2 (en) * 2013-01-29 2015-04-14 Xerox Corporation Detection of numbered captions
CN104111944B (zh) * 2013-04-19 2018-09-18 阿里巴巴集团控股有限公司 页面处理方法和装置以及页面生成方法和装置
JP6463914B2 (ja) 2014-06-30 2019-02-06 キヤノン株式会社 情報処理装置、処理方法、及びプログラム
US10248630B2 (en) * 2014-12-22 2019-04-02 Microsoft Technology Licensing, Llc Dynamic adjustment of select elements of a document
CN105139342A (zh) * 2015-09-29 2015-12-09 天脉聚源(北京)教育科技有限公司 一种图片缩放的方法和装置
JP6649832B2 (ja) * 2016-03-30 2020-02-19 キヤノン株式会社 情報処理装置およびその制御方法、並びにプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002165079A (ja) * 2000-11-27 2002-06-07 Minolta Co Ltd 画像処理装置及び方法
JP2005108194A (ja) * 2003-09-09 2005-04-21 Seiko Epson Corp 画質調整情報の生成および画質調整情報を用いた画質調整

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JP2000163044A (ja) 1998-11-30 2000-06-16 Sharp Corp 画像表示装置
JP2002073598A (ja) 2000-08-24 2002-03-12 Canon Inc 文書処理装置および方法
JP2002351779A (ja) * 2001-05-22 2002-12-06 Minolta Co Ltd データ表示システム、データ送信装置、携帯端末、データ表示方法、データ表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002165079A (ja) * 2000-11-27 2002-06-07 Minolta Co Ltd 画像処理装置及び方法
JP2005108194A (ja) * 2003-09-09 2005-04-21 Seiko Epson Corp 画質調整情報の生成および画質調整情報を用いた画質調整

Also Published As

Publication number Publication date
US7853873B2 (en) 2010-12-14
JP2007013550A (ja) 2007-01-18
US20070003139A1 (en) 2007-01-04

Similar Documents

Publication Publication Date Title
JP4574467B2 (ja) データ処理装置、データ処理方法およびコンピュータプログラム
JP4748268B2 (ja) モバイルデバイスでのパノラマイメージ印刷要請方法とその記録媒体及びその装置並びに印刷方法とその印刷装置及びイメージ形成装置
JP2010033551A (ja) デザイン編集装置及びデザイン編集方法およびデザイン編集プログラム
JP2007013550A5 (ja)
JP2007066188A (ja) 画像処理装置およびその方法
JP2008278362A (ja) 情報処理装置及び情報処理方法
US8269791B2 (en) Information processing apparatus and method for processing a vector image composed of a plurality of objects described by structured document data
JP5629509B2 (ja) 情報処理装置、情報閲覧装置、情報処理方法、およびプログラム
JP2005044279A (ja) 帳票処理方法、帳票処理プログラム、帳票処理装置
US20080231869A1 (en) Method and apparatus for displaying document image, and computer program product
JP2006018630A (ja) データ検索方法及び装置、プログラム、コンピュータ可読メモリ
JP5674451B2 (ja) ビューワ装置、閲覧システム、ビューワプログラム及び記録媒体
JP2010074292A (ja) 画像処理装置、画像表示システム、及びプログラム
JP2008147850A (ja) デザイン編集方法およびデザイン編集装置およびデザイン編集プログラム
JP2012008884A (ja) 編集装置、編集装置におけるレイアウト編集方法およびプログラム
JP2011086050A (ja) 情報処理端末及びコンピュータプログラム
JP6128898B2 (ja) 情報処理装置、情報処理装置の制御方法、プログラム
JP2006262442A (ja) 画像編集装置と画像編集方法
US9692936B2 (en) Image processing apparatus and image processing method for clipping, from a second image, an area at a position corresponding to designated position in a first image
JP2006184415A (ja) 画像処理装置、画像処理プログラム及び画像処理方法
JP2017102939A (ja) オーサリング装置、オーサリング方法、およびプログラム
JP2003196638A (ja) ファイリングデータのサムネイルキャプチャリングシステム及びプログラム
JP5528410B2 (ja) ビューワ装置、サーバ装置、表示制御方法、電子コミック編集方法及びプログラム
JP2011186835A (ja) 画像処理装置及び画像処理プログラム
JP6223117B2 (ja) 情報処理装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080630

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080630

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091228

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100405

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100817

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100818

R150 Certificate of patent or registration of utility model

Ref document number: 4574467

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130827

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees