JP2001236517A - 構造化画像データ処理方法及びその装置、並びに構造化画像データ処理プログラム - Google Patents

構造化画像データ処理方法及びその装置、並びに構造化画像データ処理プログラム

Info

Publication number
JP2001236517A
JP2001236517A JP2000379878A JP2000379878A JP2001236517A JP 2001236517 A JP2001236517 A JP 2001236517A JP 2000379878 A JP2000379878 A JP 2000379878A JP 2000379878 A JP2000379878 A JP 2000379878A JP 2001236517 A JP2001236517 A JP 2001236517A
Authority
JP
Japan
Prior art keywords
data
image data
area
document image
structured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000379878A
Other languages
English (en)
Inventor
Koichi Hata
幸一 畑
Hiroyuki Tada
浩之 多田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000379878A priority Critical patent/JP2001236517A/ja
Publication of JP2001236517A publication Critical patent/JP2001236517A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 文書画像を部分的に処理し、構造化画像デー
タの情報を損なうことなく、効率的に伝送、蓄積するこ
とを目的とする。 【解決手段】 文書画像データとその配置データからな
る構造化画像データと、文書画像データ内部の複数の領
域を示す領域データとからなる入力データを入力し、所
定の分割情報により、前記文書画像データの分割する領
域を決定する分割領域決定ステップと、前記分割する領
域により、文書画像データを複数の文書画像データに分
割する画像分割ステップと、前記分割された文書画像デ
ータをそれぞれ部分的に処理する画像処理ステップと、
処理前の前記配置データと前記文書画像データをそれぞ
れ画像処理後のデータに置き換えて構造化画像データを
更新する構造化画像更新ステップとを備えたことを特徴
とするものである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、構造化画像データ
の伝送・蓄積のための構造化画像データ処理方法及びそ
の装置、並びに構造化画像データ処理プログラムに関す
るものである。
【0002】
【従来の技術】従来、HTML(www.w3c.org)のよう
に文書画像データとその配置データを含む情報を効率よ
く伝送、蓄積するために、HTMLのデータを送信する
サーバや、中継する中継ノードで、内部に含まれる文書
画像データのサイズを小さくしたり、色数を減したりと
画質調節によるデータ量抑制処理が行われる。また、文
書画像データをそれに付加されたテキストデータと置き
換えて文書画像データを省略する処理が行われる。
【0003】これらの処理は、Internet Transcoding f
or Universal Accessと呼ばれ、文献(R. Han, P. Bhag
wat, "Dynamic Adaptation In an Image Transcoding P
roxy For Mobile Web Browsing", IEEE Personal Comm
unications Magazine, Dec.1998, pp. 8-17.)や文献
( J. R. Smith, R. Mohan, C.-S. Li, "Content-based
Transcoding of Images in the Internet," Proceedi
ngs of the International Conference on Image Proc
essing (ICIP), 1998)にHTMLデータの伝送を中継
する中継ノードで画像のサイズの変更や、カラー画像を
グレー画像、白黒画像に変更する処理が記述されてい
る。
【0004】図32は従来の処理装置3200のブロッ
ク図である。図32において、文書画像データとその配
置データを用いて、文書画像データのサイズを小さくし
たり、色数を減らしたりする処理は、文書画像データを
一様にサイズを小さくしたり、一様に色数を減らす処理
を実施する。
【0005】
【発明が解決しようとする課題】しかしながら、上述の
文書画像データとその配置データを用いて、文書画像デ
ータのサイズを小さくしたり、色数を減らしたりする処
理では、文書画像データを一様にサイズを小さくした
り、色数を減らすことしかできない。
【0006】したがって、同一画像中に文字領域や写真
領域が同時に含まれていても、同時に減色処理か縮小処
理かを行うこととなる。
【0007】例えば、文字領域や写真を含む記事をスキ
ャナーにより取りこんだ文書画像(ここで文書画像の定
義をしている)において、減色処理を行うと、文書画像
中の文字や図の部分はさして内容の理解に困難にならな
いが、風景の写真はなにが写されているか理解しにくく
なる。一方、サイズ縮小処理を行うと、風景の写真はサ
イズを小さくしても内容の理解が困難にならないが、文
字や図の部分は、線が途切れてしまい内容が理解できな
くなる。
【0008】また、文書画像に限らず、図と写真の混在
する画像や、画像の一部分が特に重要で他の部分が重要
でない画像など、画像領域がそれそれ異なる性質を持つ
場合、以上のような問題が生じる。
【0009】本発明は、従来のこのような課題を考慮
し、蓄積・伝送すべき文書画像の内部の領域データを用
いて、領域毎に文書画像を分割したそれぞれの文書画像
に合った処理を行い、領域データから配置データを作成
することによって、構造化画像データの情報をなるべく
損なうことなく、効率的に伝送、蓄積する方法とその装
置、プログラムを提供することを目的とする。
【0010】
【課題を解決するための手段】文書画像データとその配
置データからなる構造化画像データと、文書画像データ
内部の複数の領域を示す領域データとからなる入力デー
タを入力し、所定の分割情報により、前記文書画像デー
タの分割する領域を決定する分割領域決定ステップと、
前記分割する領域により、文書画像データを複数の文書
画像データに分割する画像分割ステップと、前記分割さ
れた文書画像データをそれぞれ部分的に処理する画像処
理ステップと、処理前の前記配置データと前記文書画像
データをそれぞれ画像処理後のデータに置き換えて構造
化画像データを更新する構造化画像更新ステップとを備
えたことを特徴とする構造化画像データ処理方法であ
る。
【0011】また、文書画像データとその配置データか
らなる構造化画像データと、文書画像データ内部の複数
の領域を示す領域データと、領域データに付加されたテ
キストデータとからなる入力データを入力し、前記領域
データに付加されたテキストデータにより分割する領域
を決定する分割領域決定ステップと、前記分割すべき領
域により、前記文書画像データを複数の文書画像データ
に分割する画像分割ステップと、前記分割された文書画
像に対応する領域データに付加されたテキストデータに
分割された文書画像を置き換えるテキスト置換ステップ
と、前記配置データと、前記文書画像データと、テキス
トデータを置き換えて構造化画像データを更新する構造
化画像更新ステップとを備えたことを特徴とする構造化
画像データ処理方法である。
【0012】また、文書画像データ1とその配置データ
からなる構造化画像データ1と、文書画像データ1内部
の複数の領域を示す領域データ1とを備えた第1の入力
データと、文書画像データ2とその配置データからなる
構造化画像データ2と、文書画像データ2内部の複数の
領域を示す領域データ2とを備えた第2の入力データと
を入力し、前記第2の入力データを参照しながら前記第
1の入力データのうち更新すべき領域を分割すべき領域
として決定する分割領域決定ステップと、前記分割すべ
き領域により、前記文書画像データ1を複数の文書画像
データに分割する画像分割ステップと、前記分割により
構造化画像データの更新を行う構造化画像データ更新ス
テップと、前記更新された構造化画像データと構造化画
像データ2を合成する構造化画像データ合成ステップと
を備えたことを特徴とする構造化画像データ処理方法で
ある。
【0013】また、文書画像データ1とその配置データ
1からなる構造化画像データ1と、前記画像データ1内
部の複数の領域を示す領域データ1と、配置データ1も
しくは領域データ1のひとつまたは複数に付加されたス
コアデータ1とを備えた第1の入力データと、文書画像
データ2とその配置データからなる構造化画像データ2
と、文書画像データ2内部の複数の領域を示す領域デー
タ2と、配置データ2もしくは領域データ2のひとつま
たは複数に付加されたスコアデータ2とを備えた第2の
入力データを入力し、前記第2の入力データを参照しな
がら、前記第1の入力データのうち更新すべき領域を、
分割すべき領域として決定するスコア付き分割領域決定
ステップと、前記分割すべき領域により、前記文書画像
データを複数の文書画像データに分割する画像分割ステ
ップと、前記第1の入力データの分割による構造化画像
データの更新を行う構造化画像データ更新ステップと、
更新された構造化画像データ1と構造化画像データ2を
前記スコアデータ1及びスコアデータ2を用いて合成す
るスコア付き構造化画像データ合成ステップとを備えた
ことを特徴とする構造化画像データ処理方法である。
【0014】また、文書画像データとその配置データか
らなる構造化画像データと、文書画像データ内部の複数
の領域を示す領域データを入力し、所定の分割情報によ
り前記文書画像データの分割すべき領域を決定する分割
領域決定手段と、前記分割すべき領域により文書画像デ
ータを複数の文書画像データに分割する画像分割手段
と、前記分割された文書画像をそれぞれ部分的に処理す
る画像処理手段と、処理前の前記配置データと前記文書
画像データを処理後のデータに置き換えて構造化画像デ
ータを更新する構造化画像更新手段とを備えたことを特
徴とする構造化画像データ処理装置である。
【0015】また、文書画像データとその配置データか
らなる構造化画像データと、文書画像データ内部の複数
の領域を示す領域データと、領域データに付加されたテ
キストデータとからなる入力データを入力し、前記領域
データに付加されたテキストデータにより分割する領域
を決定する分割領域決定手段と、前記分割すべき領域に
より、前記文書画像データを複数の文書画像データに分
割する画像分割手段と、前記分割された文書画像に対応
する領域データに付加されたテキストデータに分割され
た文書画像を置き換えるテキスト置換手段と、前記配置
データと、前記文書画像データと、テキストデータを置
き換えて構造化画像データを更新する構造化画像更新手
段とを備えたことを特徴とする構造化画像データ処理装
置である。
【0016】また、文書画像データ1とその配置データ
からなる構造化画像データ1と、文書画像データ1内部
の複数の領域を示す領域データ1とを備えた第1の入力
データと、文書画像データ2とその配置データからなる
構造化画像データ2と、文書画像データ2内部の複数の
領域を示す領域データ2とを備えた第2の入力データと
を入力し、前記第2の入力データを参照しながら前記第
1の入力データのうち更新すべき領域を分割すべき領域
として決定する分割領域決定手段と、前記分割すべき領
域により、前記文書画像データ1を複数の文書画像デー
タに分割する画像分割手段と、前記分割により構造化画
像データの更新を行う構造化画像データ更新手段と、前
記更新された構造化画像データと構造化画像データ2を
合成する構造化画像データ合成手段と備えたことを特徴
とする構造化画像データ処理装置である。
【0017】また、文書画像データ1とその配置データ
1からなる構造化画像データ1と、前記文書画像データ
1内部の複数の領域を示す領域データ1と、配置データ
1もしくは領域データ1のひとつまたは複数に付加され
たスコアデータ1とを備えた第1の入力データと、文書
画像データ2とその配置データからなる構造化画像デー
タ2と、文書画像データ2内部の複数の領域を示す領域
データ2と、配置データ2もしくは領域データ2のひと
つまたは複数に付加されたスコアデータ2とを備えた第
2の入力データを入力し、前記第2の入力データを参照
しながら、前記第1の入力データのうち更新すべき領域
を、分割すべき領域として決定するスコア付き分割領域
決定手段と、前記分割すべき領域により、前記文書画像
データを複数の文書画像データに分割する画像分割手段
と、前記第1の入力データの分割による構造化画像デー
タの更新を行う構造化画像データ更新手段と、更新され
た構造化画像データ1と構造化画像データ2を前記スコ
アデータ1及びスコアデータ2を用いて合成するスコア
付き構造化画像データ合成手段とを備えたことを特徴と
する構造化画像データ処理装置である。
【0018】また、文書画像データとその配置データか
らなる構造化画像データと、文書画像データ内部の複数
の領域を示す領域データとからなる入力データを入力
し、所定の分割情報により、前記文書画像データの分割
する領域を決定する分割領域決定ステップと、前記分割
する領域により、文書画像データを複数の文書画像デー
タに分割する画像分割ステップと、前記分割された文書
画像データをそれぞれ部分的に処理する画像処理ステッ
プと、処理前の前記配置データと前記文書画像データを
それぞれ画像処理後のデータに置き換えて構造化画像デ
ータを更新する構造化画像更新ステップとを備えたこと
を特徴とする構造化画像データ処理プログラムである。
【0019】また、文書画像データとその配置データか
らなる構造化画像データと、文書画像データ内部の複数
の領域を示す領域データと、領域データに付加されたテ
キストデータとからなる入力データを入力し、前記領域
データに付加されたテキストデータにより分割する領域
を決定する分割領域決定ステップと、前記分割すべき領
域により、前記文書画像データを複数の文書画像データ
に分割する画像分割ステップと、前記分割された文書画
像に対応する領域データに付加されたテキストデータに
分割された文書画像を置き換えるテキスト置換ステップ
と、前記配置データと、前記文書画像データと、テキス
トデータを置き換えて構造化画像データを更新する構造
化画像更新ステップとを備えたことを特徴とする構造化
画像データ処理プログラムである。
【0020】また、文書画像データ1とその配置データ
からなる構造化画像データ1と、文書画像データ1内部
の複数の領域を示す領域データ1とを備えた第1の入力
データと、文書画像データ2とその配置データからなる
構造化画像データ2と、文書画像データ2内部の複数の
領域を示す領域データ2とを備えた第2の入力データと
を入力し、前記第2の入力データを参照しながら前記第
1の入力データのうち更新すべき領域を分割すべき領域
として決定する分割領域決定ステップと、前記分割すべ
き領域により、前記文書画像データ1を複数の文書画像
データに分割する画像分割ステップと、前記分割により
構造化画像データの更新を行う構造化画像データ更新ス
テップと、前記更新された構造化画像データと構造化画
像データ2を合成する構造化画像データ合成ステップと
を備えたことを特徴とする構造化画像データ処理プログ
ラムである。
【0021】また、文書画像データ1とその配置データ
1からなる構造化画像データ1と、前記画像データ1内
部の複数の領域を示す領域データ1と、配置データ1も
しくは領域データ1のひとつまたは複数に付加されたス
コアデータ1とを備えた第1の入力データと、文書画像
データ2とその配置データからなる構造化画像データ2
と、文書画像データ2内部の複数の領域を示す領域デー
タ2と、配置データ2もしくは領域データ2のひとつま
たは複数に付加されたスコアデータ2とを備えた第2の
入力データを入力し、前記第2の入力データを参照しな
がら、前記第1の入力データのうち更新すべき領域を、
分割すべき領域として決定するスコア付き分割領域決定
ステップと、前記分割すべき領域により、前記文書画像
データを複数の文書画像データに分割する画像分割ステ
ップと、前記第1の入力データの分割による構造化画像
データの更新を行う構造化画像データ更新ステップと、
更新された構造化画像データ1と構造化画像データ2を
前記スコアデータ1及びスコアデータ2を用いて合成す
るスコア付き構造化画像データ合成ステップとを備えた
ことを特徴とする構造化画像データ処理プログラムであ
る。
【0022】
【発明の実施の形態】以下、本発明にかかる実施の形態
について図面を参照しながら説明する。
【0023】それぞれの実施の形態についての説明に先
立って、本発明の方法、装置、コンピュータプログラム
プロダクトを実現する構成の全体について説明する。
【0024】図31において、本発明の構造化画像デー
タ処理装置3000は、構造化画像データ処理部300
2、受信部3004、送信部3006とを含んでいる。
処理部3002は、受信部3004から入力された構造
化画像データを処理し、処理後の構造化画像データを送
信部3006へ出力する。受信部3002はネットワー
クなどからデータを受信する。送信部3006はネット
ワークなどへデータを送出する。
【0025】また、処理部3002は、構造化画像デー
タ蓄積部3008から構造化画像データを取り込み、処
理した構造化画像データを蓄積部3008へ蓄積のため
に出力することもできる。
【0026】以下の実施の形態では、主に、構造化画像
データ処理部における処理について説明する。以下の実
施の形態では、構造化画像データ処理部3002は、図
1の処理部100、図9の処理部900、図12の処理
部1200、図16の処理部1600、図25の処理部
2500、図30の処理部3000に相当する。
【0027】(実施の形態1)図1は、本発明の実施の
形態1における構造化画像データ処理部100の構成を
示すブロック図であり、同図を用いて本実施の形態につ
いて説明する。
【0028】同図において、分割領域決定セクション1
01は、配置データと領域データから画像分割を行う領
域を決定する。画像分割セクション102では、文書画
像データを分割領域決定セクション101で決定された
領域に対応する文書画像データに分割する。画像処理セ
クション103では、分割した文書画像データを処理す
る。構造化画像データ更新セクション104では、分割
前の画像データと配置データの代わりに分割後の文書画
像データと配置データを用いて構造化画像データを更新
する。
【0029】以上のように構成された本実施の形態の構
造化画像データ処理部100の動作を以下で説明する。
【0030】入力データは、文書画像データとその配置
データからなる構造化画像データと、各文書画像内の構
造を領域で示した領域データである。
【0031】図2は、入力データのデータ構造の説明図
である。図3は、文書画像301を、木構造データ30
2で記述した例である。具体的な例として、図26に示
す文書画像の例2600の木構造を記述したデータを図
27示す。図26の文書画像では、テキストのグルー
プ"Text group 1"、"Text group 2"、"Text group 3"と
画像(Image)Image 1、Image 2、Image 3を含んでいる。
【0032】図27において、“< ”と“ >”で挟ま
れた文字列が配置データを示している。
【0033】ここで、“SourceX= ”、“SourceY=
”が開始座標を示す。“Width=”、“height= ”が範
囲(area)の大きさをしめす。開始座標と範囲の大きさが
与えられて、<Image>と</Image>で挟まれた画像デ
ータが配置される。また、テキストデータは後述するよ
うに、たとえば、<Text>と</Text>挟んで、挿入す
ることができる。この図27のように、最初に、“Widt
h="847"”、“Height= "1168"で定義された範囲の中
に、次々に、階層的、すなわち、木構造状に(in tree
structure)範囲の開始位置と大きさを定義して、画像
やテキストデータを配置していくことができる。
【0034】図2において、入力データのデータ構造は
領域を要素201が木状に連なっている木構造である。
ひとつまたは複数の領域に画像が付加された文書画像デ
ータ付き要素202を含んでいる。この形式では、文書
画像データ付き要素202とその上位要素である要素2
01が、文書画像データの配置データであり、文書画像
データ付き要素より下位要素が画像内の領域を示した領
域データである。
【0035】以下、本実施の形態の構造化画像データ処
理の動作を各セクションごとに詳しく説明する。
【0036】分割領域決定セクション101は、図3に
示した構造化文書画像301が入力されると、その木構
造データ302に示すように領域を分けて、下記に説明
する減色処理を行って、分割すべき領域を決定する。分
割すべき領域は、領域の大きさや位置などで決定しても
良いが、本実施の形態では、文書画像データに減色処理
を行い、処理後と処理前の差異があらかじめ定められた
値よりも小さいという分割情報から、文書画像データの
分割すべき領域を決定している。
【0037】次に、分割領域決定セクション101のフ
ローチャートを図4に示し、説明する。領域減色ステッ
プS401では、領域データに対応する文書画像データ
の減色処理を行う。文書画像データが24ビットの色数
を持っていれば、8ビットへの減色処理、8ビットの色
数を持っていれば、1ビットの色数への減色処理を行
う。減色処理には、色のヒストグラムを1次元配列にし
てあるインデックスに沿って並び替え、ヒストグラムを
分割して減色する方法(Public Domain Softwareのnetp
bmパッケージにあるJ.Poskanzer 作成のppmquant.cを参
照)を用いる。
【0038】領域差分計算ステップS402では、減色
処理後の文書画像データと、減色処理前の文書画像デー
タの画素後との差分の2乗和を評価値として計算する。
領域決定ステップS403では、評価値と予め定められ
た値を比較して評価値が小さければ、分割すべき領域と
する。本実施の形態のような処理では、図5に示すよう
に、画像データ501の中の文字領域502が分割すべ
き領域として選ばれる。
【0039】画像分割セクション102では、分割領域
決定セクション101によって決定された領域により文
書画像データを分割する。図6に文書画像の分割の様子
を示す。木構造データでは、文書画像データ603付き
要素601の子要素602の領域に対応するように分割
して、分割文書画像データ604を作成する。
【0040】画像処理セクション103では、図7のよ
うに、分割された文書画像データ701のうち、分割領
域決定セクション101で決定された領域702に対応
する文書画像データの文字領域に対して減色処理を行
う。
【0041】構造化画像データ更新セクション104で
は、図8に示すように、分割された領域の領域データ8
03を配置データ804に置換し、その配置データに分
割文書画像データ805を付加して、構造化画像データ
を更新する。
【0042】木構造の更新は次のように行われる。処理
前の木構造データ(図5の画像501に相当)の文書画
像データ806は取り除き、分割文書画像データ805
を配置データ804に付加して、処理後の木構造データ
502に更新される。
【0043】以上のように、本実施の形態では、文書画
像の内部の領域データを用いて、領域毎に文書画像を分
割したそれぞれの文書画像領域に合った処理を行い、領
域データから配置データを作成することによって、構造
化画像データの情報をなるべく損なうことなく、効率的
に伝送、蓄積することが可能である。
【0044】(実施の形態2)図9は、本発明の実施の
形態2における構造化画像データ処理部900の構成を
示すブロック図であり、同図を用いて本実施の形態につ
いて説明する。実施の形態2における入力データ910
は、文書画像データとその配置データからなる構造化画
像データと、各文書画像内の構造を領域で示した領域デ
ータ、スコアデータを備え、そのデータ構造は木構造で
ある。
【0045】入力データは、文書画像データとその配置
データからなる構造化画像データと、各文書画像内の構
造を領域で示した領域データと、スコアデータである。
本実施の形態2の入力データのデータ構造は、図10に
示すように、実施の形態1と同様に木構造データであ
る。実施の形態1の図1と図10との違いは、スコアデ
ータが文書画像データと同様に要素に付加されているこ
とである。
【0046】具体的として、図26のような取り扱い説
明の文書画像の木構造を記述したデータを図28に示
す。図28において、図27との違いは< と >に挟ま
れた文字列に、スコアデータScore="X"(Xは数字)が付加
されていることである。
【0047】スコアデータは、文書画像の重要度や、文
字図形領域や写真領域といった領域の特性の識別子など
である。本実施の形態では、十進数によるスコアデータ
の一の位を重要度とし、十の位を領域の特性の識別子と
する。図11にスコアデータの示す領域の特性と重要度
の表を示す。
【0048】本実施の形態の構造化画像データ処理の動
作を以下で説明する。
【0049】図9において、スコア付き分割領域決定セ
クション901は、スコアデータを用いて文書画像分割
を行う領域を決定する。画像分割セクション902で
は、セクション901で決定された領域対応して文書画
像データを一つあるいは複数の文書画像データに分割す
る。
【0050】画像処理セクション903では、セクショ
ン902で分割された文書画像データをそれぞれ部分的
に処理する。構造化画像データ更新セクション904で
は、分割前の文書画像データと配置データを分割後の文
書画像データと配置データに置き換えて構造化画像デー
タを更新し、更新された構造化画像データ912を出力
する。
【0051】以下、本実施の形態の構造化画像データ処
理の動作を各セクションごとに詳しく説明する。ただ
し、実施の形態1と同様な処理については説明を省略す
る。
【0052】スコア付き分割領域決定セクション901
では、図10に示した木構造データが入力されると、ス
コアデータを用いて文書画像データの分割すべき領域を
決定する。本実施の形態では、予め定められた重要度よ
り小さい重要度をもつスコアデータが付加された領域を
分割すべき領域とする。
【0053】画像分割セクション902は、実施の形態
1の画像分割セクション102と同様である。
【0054】画像処理セクション903は、領域の特性
によって、文字・白黒図表領域には2色減色処理、カラ
ー図・イラスト領域には256色減色処理、写真領域に
は縮小処理を行う。
【0055】構造化画像データ更新セクション904
は、実施の形態1の構造化画像データ更新セクション1
04と同様である。
【0056】以上のように、本実施の形態では、文書画
像の内部の領域データと領域に付加されたスコアデータ
を用いることで、領域毎に文書画像を分割したそれぞれ
の文書画像領域に合った処理を行い、領域データから配
置データを作成することによって、構造化画像データの
情報をなるべく損なうことなく、効率的に伝送、蓄積す
ることが可能である。
【0057】(実施の形態3)図12は、本発明の実施
の形態3である構造化画像データ処理部1200の構成
を示すブロック図であり、同図を用いて本実施の形態に
ついて説明する。なお、実施の形態1及び実施の形態2
と共通な部分については説明を省略する。
【0058】実施の形態3の入力データ1210は、文
書画像データとその配置データからなる構造化画像デー
タと、各文書画像内の構造を領域で示した領域データ、
領域内の情報を端的に示したテキストデータを備えたも
のである。
【0059】本実施の形態の入力データの構造は、図1
3に示すように、実施の形態1と同様に木構造である。
テキストデータは、文書画像データと同様に要素に付加
されており、文書画像の簡単な説明や画像の内容を要約
したものであって、文書画像を置換して文書画像の内容
を示すテキストを表示するために使用される。
【0060】そのためテキストは分割情報であり、置換
メディアである。ここでは、置換メディア分割情報と名
付け、置換メディアはテキスト以外の図形などのメディ
アでも良い。
【0061】具体的として、図26のような取り扱い説
明の文書画像の木構造を記述したデータを図29に示
す。図29において、図27との違いは、文書画像デー
タと共に<Text>と</Text>の間に、テキストデータが
付加されていることである。また、文書画像データの代
わりにテキストデータのみを付加しても良い。
【0062】図12において、分割領域決定セクション
1201は、画像分割を行う領域を決定する。画像分割
セクション1202では、文書画像データを決定された
領域に対応する文書画像データに分割する。テキスト置
換セクション1203では、分割された文書画像データ
に対応する領域に付加されたテキストデータと文書画像
データを置きかえる。構造化画像データ更新セクション
1204では、分割前の文書画像データと配置データの
代わりに分割後の文書画像データと配置データとテキス
トデータを用いて構造化画像データを更新し、更新され
た構造化画像データ1212を出力する。
【0063】以下、本実施の形態の構造化画像データ処
理の動作を各セクションごとに詳細に説明する。なお、
実施の形態1及び実施の形態2と同様な処理については
説明を省略する。
【0064】分割領域決定セクション1201では、図
13に示した木構造データが入力されると画像分割処理
を実施する。実施の形態3では、テキストが与えられて
いる領域のすべてを分割すべき領域とする。
【0065】画像分割セクション1202は、実施の形
態1の画像分割セクション102と同様である。
【0066】テキスト置換セクション1203は、図1
4のように画像分割セクション1202で各要素140
1に分割された文書画像データ1402を要素に付加さ
れたテキストデータ1403で置き換えて文書画像デー
タとテキストデータ1404とする。
【0067】構造化画像データ更新セクション1204
は、図15のように処理前の木構造1501において、
文書画像データ1503は取り去り、分割された文書画
像のうちテキストデータを持たない領域に対応する分割
された文書画像データ1504が付加され、処理後の木
構造1502を更新する。
【0068】以上のように、本実施の形態では、文書画
像の内部の領域データと領域に付加されたテキストデー
タを用いることで、領域毎に文書画像を分割し、文書画
像データの代わりにテキストデータを付加し、領域デー
タから配置データを作成することによって、構造化画像
データの情報をなるべく損なうことなく、効率的に伝
送、蓄積することが可能である。
【0069】(実施の形態4)図16は、本発明の実施
の形態4である構造化画像データ処理部1600の構成
を示すブロック図であり、同図を用いて本実施の形態に
ついて説明する。以下では、実施の形態1から実施の形
態3と共通な部分については説明を省略する。
【0070】実施の形態4では、以下のような複数の入
力データを対象とする。
【0071】入力データは、文書画像データ1とその配
置データからなる構造化画像データ1と、文書画像デー
タ1内部の複数の領域を示す領域データ1とからなる第
1の入力データ1610と、文書画像データ2とその配
置データからなる構造化画像データ2と、文書画像デー
タ2内部の複数の領域を示す領域データ2とからなる第
2の入力データ1611である。
【0072】図17は、構造化画像データ1701を、
構造化文書画像1と領域データとを一緒に表した木構造
データ1702の例である。また、図18は、構造化画
像データ1801を、構造化文書画像2と領域データと
一緒に表した木構造データ1802の例である。
【0073】図16において、分割領域決定セクション
1601は、第1の入力データと第2の入力データの文
書画像の重複する部分を判別して、その重複する部分を
分割すべき領域とする。
【0074】画像分割セクション1602では、セクシ
ョン1601で決定された分割すべき領域に対応する文
書画像データをひとつあるいは複数の文書画像データに
分割する。構造化画像データ更新セクション1603で
は、分割前の構造化画像データ1と領域データ1を、分
割後の文書画像データに置き換えて更新する。構造化画
像データ合成セクション1604では、構造化画像デー
タ1と領域データ1と構造化画像データ2と領域データ
2を合成する。
【0075】以下、本実施の形態例の構造化画像データ
処理の動作を各セクションごとに詳細に説明する。
【0076】分割領域決定セクション1601では、第
1の入力データ1610と第2の入力データ1611が
入力すると、領域が重複する部分を判別して分割すべき
領域を決定する。2つの文書画像データの開始座標と大
きさが一致した場合に2つの文書画像は重複していると
定義する。図19は、2つの文書画像の重複の様子を示
す。図20に第1の入力データの木構造データ2001
と第2の入力データの木構造データ2002に重なる部
分がある場合を示し、2003と2004の重複する部
分は網掛けで示す。
【0077】画像分割セクション1602は、実施の形
態1の画像分割セクション102と同様であり、その様
子は図21のように、文書画像データ2101からセク
ション1601で決定された分割すべきとされた文書画
像領域2102を切り出す。
【0078】構造化画像データ更新セクション1603
では、図20の第1の入力データの木構造データ200
1は図22に示す木構造データ2201に更新される。
【0079】構造化画像データ合成セクション1604
では、図22のように更新された木構造データ2201
と第2の入力データの木構造データ2002の重複した
部分2003(網掛けを施している文書画像データ付き
要素)を第2の入力データの要素2004に置き換え、
また更新されたデータにない部分(図23における23
01)を付加して、図23のような合成木構造データを
合成し、構造化画像出力データ2401として出力す
る。これを用いて、図24に示すような構造化文書画像
データ2401が得られる。
【0080】以上のように、本実施の形態では、文書画
像の内部の領域データを用いて、領域毎に文書画像を分
割し、それぞれの合成の際に、重複となる文書画像領域
だけを置き換え、領域データから配置データを作成する
ことによって、構造化画像データの情報をなるべく損な
うことなく、効率的に伝送、蓄積することが可能であ
る。
【0081】(実施の形態5)図25は、本発明の実施
の形態5である構造化画像データ処理部2500の構成
を示すブロック図であり、同図を用いて本実施の形態に
ついて説明する。以下では、実施の形態1から実施の形
態4と共通な部分については説明を省略する。
【0082】本実施の形態では、以下のような、スコア
データがついた複数の入力データを処理する。
【0083】入力データは、文書画像データ1とその配
置データからなる構造化画像データ1と、文書画像デー
タ1内部の複数の領域を示す領域データ1と、スコアデ
ータ1とからなる第1の入力データ2510と、文書画
像データ2とその配置データからなる構造化画像データ
2と、文書画像データ2内部の複数の領域を示す領域デ
ータ2とスコアデータ2とからなる第2の入力データ2
511であり、それぞれは、図10と同様に木構造デー
タとして表せる。
【0084】本実施の形態では、スコアデータは重要度
を示す。スコアデータが大きいほど重要度が高いものと
する。
【0085】図25において、スコア付き分割領域決定
セクション2501は、後述する条件により分割すべき
領域を決定する。画像分割セクション2502では、分
割すべき領域をに対応する文書画像データをひとつある
いは複数の文書画像データに分割する。構造化画像デー
タ更新セクション2503では、構造化画像データ1と
領域データ1を分割された文書画像データに更新する。
スコア付き構造化画像データ合成セクション2504で
は、構造化画像データ1と領域データ1と構造化画像デ
ータ2と領域データ2とを、スコアデータを用いて合成
する。
【0086】以下、本実施の形態の構造化画像データ処
理の動作を各セクションごとに詳細に説明する。
【0087】スコア付き分割領域決定セクション250
1では、実施の形態4の分割領域決定セクション160
1と同様に、第1の入力データ2510と第2の入力デ
ータ2511の文書画像の領域が重複する部分を判別し
てその部分を分割すべき領域とする。2つの文書画像デ
ータの開始座標と大きさが一致した場合に重複したとす
る。ただし、その領域に対応するスコアデータ2がスコ
アデータ1よりも大きい場合に置き換えるものとする。
【0088】画像分割セクション2502は、実施の形
態4の画像分割セクション1602と同様である。
【0089】構造化画像データ更新セクション2503
は、実施の形態4の構造化画像データ更新セクション1
603と同様である。
【0090】構造化画像データ合成セクション2504
では、実施の形態4の構造化画像データ合成セクション
1604と同様であるが、重複した部分は、その領域に
対応するスコアデータ2がスコアデータ1より大きい場
合のみ置き換え、構造化画像出力データ2512を出力
する。
【0091】以上のように、本実施の形態では、文書画
像の内部の領域データを用いて、領域毎に文書画像を分
割し、それぞれの合成の際に、重複となる文書画像領域
だけを置き換え、領域データから配置データを作成する
ことによって、構造化画像データの情報をなるべく損な
うことなく、効率的に伝送、蓄積することが可能であ
る。
【0092】(実施の形態6)図30は、本発明の実施
の形態6である構造化画像データ処理部3100の構成
を示すブロック図であり、同図を用いて本実施の形態に
ついて説明する。以下では、実施の形態1から実施の形
態5と共通な部分についての説明は省略する。
【0093】本実施の形態6の入力データ3111は実
施の形態2と同様であるが、分割すべき領域を決定する
場合は、伝送容量やユーザリクエストを考慮するもので
ある。
【0094】図30において、スコア付き分割領域決定
セクション3101は、スコアデータと伝送容量データ
とユーザリクエストデータを用いて文書画像分割を行う
領域を決定する。画像分割セクション3102では、文
書画像データをひとつあるいは複数の文書画像データに
分割する。画像処理セクション3103では、分割した
文書画像データをそれぞれ部分的に処理する。構造化画
像データ更新セクション3104では、分割前の文書画
像データとその配置データを、分割後の文書画像データ
とその配置データを用いて構造化画像データを更新し、
更新された構造化画像データ3112を出力する。
【0095】入力データ3111は、文書画像データと
その配置データからなる構造化画像データと、各文書画
像内の構造を領域で示した領域データと、スコアデータ
である。本実施の形態でも実施の形態2と同様に木構造
データと捉え、入力データは図10のように表せ、スコ
アデータは、文書画像データと同様に要素に付加されて
いる。
【0096】具体的として、図26のような文書画像の
木構造を記述したデータを図28に示す。図27と同様
だがスコアデータが付加されている。
【0097】スコアデータは、文書画像の重要度や、文
字図形領域や写真領域といった領域の特性の識別子とし
てもよい。本実施の形態では、十進数によるスコアデー
タの一の位を重要度とし、十の位を領域の特性の識別子
とする。図11にスコアデータの示す領域の特性と重要
度の表をしめす。
【0098】以下、本実施の形態6の構造化画像データ
処理の動作について、各セクションごとに詳細に説明す
る。
【0099】実施の形態2と同様にスコアデータを含ん
だ入力データ3111が入力されると、スコア付き分割
領域決定セクション3101では、まず、入力データ3
111を伝送する目的地までの伝送容量を示す伝送容量
データと、ユーザがデータをどれくらいの時間内にほし
いかを示すユーザリクエストデータ3113から、入力
データ3111をデータ量調節するための目標とするデ
ータ量を算出する。
【0100】ここでは、目標とするデータ量は、伝送容
量K(ビット毎秒)と、ユーザリクエストN(秒)を用
いて、K×N(ビット)と計算する。
【0101】画像分割セクション3102と画像処理セ
クション3103により、文書画像を分割、処理し、目
標のデータ量とするための分割領域を決定する。ここで
は、実際に文書画像の分割や処理を試行し、目標のデー
タ量になる分割領域を決定する。
【0102】画像分割セクション3102は、実施の形
態2の画像分割セクション902と同様である。
【0103】画像処理セクション3103は、実施の形
態2の画像処理セクション903と同様であるが、領域
の特性によって、文字・白黒図表領域には2色減色処
理、カラー図・イラスト領域には256色減色処理、写
真領域には縮小処理を施す。
【0104】構造化画像データ更新セクション3104
は、実施の形態2の構造化画像データ更新セクション9
04と同様であり、構造化画像出力データ3112を出
力する。
【0105】以上のように、本実施の形態では、文書画
像の内部の領域データと領域に付加されたスコアデータ
と伝送容量データ、ユーザリクエストデータを用いるこ
とで、領域毎に文書画像を分割したそれぞれの文書画像
領域に合った処理を行い、領域データから配置データを
作成することによって、構造化画像データの情報をなる
べく損なうことなく、効率的に伝送、蓄積することが可
能である。
【0106】以上では、主として本発明の構造化画像デ
ータ処理部について説明をした。それぞれの実施の形態
で示した各セクションでの処理を実行する方法は、本発
明で実行できる。
【0107】また、それぞれの実施の形態で示した各セ
クションでの処理を実行する手段を備えた装置は、本発
明を実現できる。
【0108】さらに、それぞれの実施の形態で示した各
セクションの処理を実行するプログラムコードを備えた
コンピュータプログラムは、本発明で実行できる。
【0109】
【発明の効果】本発明の構造化画像データ処理方法で
は、以下の理由により、従来の構造化画像データ処理方
法を用いるよりも、構造化画像データの情報のなるべく
損なわず、効率の良い伝送、蓄積が可能となる。
【0110】1、構造化画像データに文書画像内部の領
域データを付加することによって、文書画像データを部
分的に処理する。
【0111】2、構造化画像データに文書画像内部の領
域データとスコアデータを付加することによって、スコ
アデータをつけた作成者の意図を保ちながら、文書画像
データを部分的に処理する。
【0112】3、構造化画像データに文書画像内部の領
域データとテキストデータを付加することにより、文書
画像データの一部分をテキストデータに変換する。
【0113】4、構造化画像データに文書画像内部の領
域データを持つふたつの入力データを用いることで、文
書画像データの一部分をもうひとつの構造化画像データ
に置き換える。
【0114】5、構造化画像データに文書画像内部の領
域データとスコアデータを持つふたつの入力データを用
いることで、文書画像データの一部分を、スコアデータ
を付加した作成者の意図を保ちながら、もうひとつの構
造化画像データに置き換える。
【図面の簡単な説明】
【図1】本発明の実施の形態1における構造化画像デー
タ処理部のブロック図
【図2】構造化画像データと領域データの木構造表現の
説明図
【図3】構造化画像データと領域データの具体例の図
【図4】分割画像決定セクションのフローチャート
【図5】分割すべき領域の説明図
【図6】画像分割セクションの説明図
【図7】画像処理セクションの説明図
【図8】構造化画像データ更新セクションの説明図
【図9】本発明の実施の形態2における構造化画像デー
タ処理部のブロック図
【図10】構造化画像データと領域データとスコアデー
タの木構造表現の説明図
【図11】スコアデータの説明図
【図12】本発明の実施の形態3における構造化画像デ
ータ処理部のブロック図
【図13】構造化画像データと領域データとテキストデ
ータの木構造表現の説明図
【図14】テキスト置換セクションの説明図
【図15】実施の形態3における構造化画像データ更新
セクションの説明図
【図16】本発明の実施の形態4における構造化画像デ
ータ処理部のブロック図
【図17】実施の形態4の第1の入力データの説明図
【図18】実施の形態4の第2の入力データの説明図
【図19】文書画像における重複した領域の説明図
【図20】木構造における重複した領域の説明図
【図21】画像分割セクションの説明図
【図22】更新された木構造データの図
【図23】合成された木構造データの図
【図24】合成された構造化画像データの図
【図25】本発明の実施の形態5における構造化画像デ
ータ処理部のブロック図
【図26】文書画像の説明図
【図27】木構造データ記述例の図
【図28】木構造データ記述例の図
【図29】木構造データ記述例の図
【図30】本発明の実施の形態6における構造化画像デ
ータ処理部のブロック図
【図31】本発明の構造化画像データ処理装置の全体構
成図
【図32】従来の処理方法を示す図
【符号の説明】
101 分割領域決定セクション 102 画像分割セクション 103 画像処理セクション 104 構造化画像データ更新セクション 201 要素 202 文書画像データ付き要素 301 構造化文書画像 302 木構造データ 501 画像データ 502 文字領域 601 要素 602 子要素 603 文書画像データ 604 分割文書画像データ 701 分割された文書画像データ 702 決定された領域 801 処理前の木構造データ 802 処理後の木構造データ 803 領域データ 804 配置データ 805 分割した文書画像データ 806 文書画像データ 901 スコア付き分割領域決定セクション 902 画像分割セクション 903 画像処理セクション 904 構造化画像データ更新セクション 1201 分割領域決定セクション 1202 画像分割セクション 1203 テキスト置換セクション 1204 構造化画像データ更新セクション 1401 要素 1402 分割された文書画像データ 1403 要素に付加されたテキストデータ 1404 文書画像データとテキストデータ 1501 処理前の木構造データ 1502 処理後の木構造データ 1503 文書画像データ 1504 分割された文書画像データ 1601 分割領域決定セクション 1602 画像分割セクション 1603 構造化画像データ更新セクション 1604 構造化画像データ合成セクション 1701 構造化文書画像 1702 木構造データ 1801 構造化文書画像 1802 木構造データ 2001 第1の入力データの木構造データ 2002 第2の入力データの木構造データ 2101 文書画像データ 2102 分割すべき領域 2401 構造化文書画像データ 2501 スコア付き分割領域決定セクション 2502 画像分割セクション 2503 構造化画像データ更新セクション 2504 スコア付き構造化画像データ合成セクション 2600 文書画像データ 3101 スコア付き分割領域決定セクション 3102 画像分割セクション 3103 画像処理セクション 3104 構造化画像データ更新セクション

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 文書画像データとその配置データからな
    る構造化画像データと、文書画像データ内部の複数の領
    域を示す領域データとからなる入力データを入力し、所
    定の分割情報により、前記文書画像データの分割する領
    域を決定する分割領域決定ステップと、前記分割する領
    域により、文書画像データを複数の文書画像データに分
    割する画像分割ステップと、前記分割された文書画像デ
    ータをそれぞれ部分的に処理する画像処理ステップと、
    処理前の前記配置データと前記文書画像データをそれぞ
    れ画像処理後のデータに置き換えて構造化画像データを
    更新する構造化画像更新ステップとを備えたことを特徴
    とする構造化画像データ処理方法。
  2. 【請求項2】 前記分割情報が、前記文書画像データの
    減色処理後と処理前の差異により求めることを特徴とす
    る請求項1記載の構造化画像データ処理方法。
  3. 【請求項3】 前記分割情報が、前記配置データもしく
    は前記領域データに付加されたスコアデータであること
    を特徴とする請求項1記載の構造化画像データ処理方
    法。
  4. 【請求項4】 前記分割情報が、前記配置データもしく
    は前記領域データに付加されたスコアデータと、構造化
    画像データを伝送する伝送路の伝送容量とユーザリクエ
    ストであることを特徴とする請求項1記載の構造化画像
    データ処理方法。
  5. 【請求項5】 文書画像データとその配置データからな
    る構造化画像データと、文書画像データ内部の複数の領
    域を示す領域データと、領域データに付加されたテキス
    トデータとからなる入力データを入力し、前記領域デー
    タに付加されたテキストデータにより分割する領域を決
    定する分割領域決定ステップと、前記分割すべき領域に
    より、前記文書画像データを複数の文書画像データに分
    割する画像分割ステップと、前記分割された文書画像に
    対応する領域データに付加されたテキストデータに分割
    された文書画像を置き換えるテキスト置換ステップと、
    前記配置データと、前記文書画像データと、テキストデ
    ータを置き換えて構造化画像データを更新する構造化画
    像更新ステップとを備えたことを特徴とする構造化画像
    データ処理方法。
  6. 【請求項6】 文書画像データ1とその配置データから
    なる構造化画像データ1と、文書画像データ1内部の複
    数の領域を示す領域データ1とを備えた第1の入力デー
    タと、文書画像データ2とその配置データからなる構造
    化画像データ2と、文書画像データ2内部の複数の領域
    を示す領域データ2とを備えた第2の入力データとを入
    力し、前記第2の入力データを参照しながら前記第1の
    入力データのうち更新すべき領域を分割すべき領域とし
    て決定する分割領域決定ステップと、前記分割すべき領
    域により、前記文書画像データ1を複数の文書画像デー
    タに分割する画像分割ステップと、前記分割により構造
    化画像データの更新を行う構造化画像データ更新ステッ
    プと、前記更新された構造化画像データと構造化画像デ
    ータ2を合成する構造化画像データ合成ステップとを備
    えたことを特徴とする構造化画像データ処理方法。
  7. 【請求項7】 文書画像データ1とその配置データ1か
    らなる構造化画像データ1と、前記文書画像データ1内
    部の複数の領域を示す領域データ1と、配置データ1も
    しくは領域データ1のひとつまたは複数に付加されたス
    コアデータ1とを備えた第1の入力データと、文書画像
    データ2とその配置データからなる構造化画像データ2
    と、文書画像データ2内部の複数の領域を示す領域デー
    タ2と、配置データ2もしくは領域データ2のひとつま
    たは複数に付加されたスコアデータ2とを備えた第2の
    入力データを入力し、前記第2の入力データを参照しな
    がら、前記第1の入力データのうち更新すべき領域を、
    分割すべき領域として決定するスコア付き分割領域決定
    ステップと、前記分割すべき領域により、前記文書画像
    データを複数の文書画像データに分割する画像分割ステ
    ップと、前記第1の入力データの分割による構造化画像
    データの更新を行う構造化画像データ更新ステップと、
    更新された構造化画像データ1と構造化画像データ2を
    前記スコアデータ1及びスコアデータ2を用いて合成す
    るスコア付き構造化画像データ合成ステップとを備えた
    ことを特徴とする構造化画像データ処理方法。
  8. 【請求項8】 文書画像データとその配置データからな
    る構造化画像データと、文書画像データ内部の複数の領
    域を示す領域データを入力し、所定の分割情報により前
    記文書画像データの分割すべき領域を決定する分割領域
    決定手段と、前記分割すべき領域により文書画像データ
    を複数の文書画像データに分割する画像分割手段と、前
    記分割された文書画像をそれぞれ部分的に処理する画像
    処理手段と、処理前の前記配置データと前記文書画像デ
    ータを処理後のデータに置き換えて構造化画像データを
    更新する構造化画像更新手段とを備えたことを特徴とす
    る構造化画像データ処理装置。
  9. 【請求項9】 前記分割情報が、前記文書画像データの
    減色処理後と処理前の差異により求めることを特徴とす
    る請求項8記載の構造化画像データ処理装置。
  10. 【請求項10】 前記分割情報が、前記配置データもし
    くは前記領域データに付加されたスコアデータであるこ
    とを特徴とする請求項8記載の構造化画像データ処理装
    置。
  11. 【請求項11】 前記分割情報が、前記配置データもし
    くは前記領域データに付加されたスコアデータと、構造
    化画像データを伝送する伝送路の伝送容量とユーザリク
    エストであることを特徴とする請求項8記載の構造化画
    像データ処理装置。
  12. 【請求項12】 文書画像データとその配置データから
    なる構造化画像データと、文書画像データ内部の複数の
    領域を示す領域データと、領域データに付加されたテキ
    ストデータとからなる入力データを入力し、前記領域デ
    ータに付加されたテキストデータにより分割する領域を
    決定する分割領域決定手段と、前記分割すべき領域によ
    り、前記文書画像データを複数の文書画像データに分割
    する画像分割手段と、前記分割された文書画像に対応す
    る領域データに付加されたテキストデータに分割された
    文書画像を置き換えるテキスト置換手段と、前記配置デ
    ータと、前記文書画像データと、テキストデータを置き
    換えて構造化画像データを更新する構造化画像更新手段
    とを備えたことを特徴とする構造化画像データ処理装
    置。
  13. 【請求項13】 文書画像データ1とその配置データか
    らなる構造化画像データ1と、文書画像データ1内部の
    複数の領域を示す領域データ1とを備えた第1の入力デ
    ータと、文書画像データ2とその配置データからなる構
    造化画像データ2と、文書画像データ2内部の複数の領
    域を示す領域データ2とを備えた第2の入力データとを
    入力し、前記第2の入力データを参照しながら前記第1
    の入力データのうち更新すべき領域を分割すべき領域と
    して決定する分割領域決定手段と、前記分割すべき領域
    により、前記文書画像データ1を複数の文書画像データ
    に分割する画像分割手段と、前記分割により構造化画像
    データの更新を行う構造化画像データ更新手段と、前記
    更新された構造化画像データと構造化画像データ2を合
    成する構造化画像データ合成手段と備えたことを特徴と
    する構造化画像データ処理装置。
  14. 【請求項14】 文書画像データ1とその配置データ1
    からなる構造化画像データ1と、前記文書画像データ1
    内部の複数の領域を示す領域データ1と、配置データ1
    もしくは領域データ1のひとつまたは複数に付加された
    スコアデータ1とを備えた第1の入力データと、文書画
    像データ2とその配置データからなる構造化画像データ
    2と、文書画像データ2内部の複数の領域を示す領域デ
    ータ2と、配置データ2もしくは領域データ2のひとつ
    または複数に付加されたスコアデータ2とを備えた第2
    の入力データを入力し、前記第2の入力データを参照し
    ながら、前記第1の入力データのうち更新すべき領域
    を、分割すべき領域として決定するスコア付き分割領域
    決定手段と、前記分割すべき領域により、前記文書画像
    データを複数の文書画像データに分割する画像分割手段
    と、前記第1の入力データの分割による構造化画像デー
    タの更新を行う構造化画像データ更新手段と、更新され
    た構造化画像データ1と構造化画像データ2を前記スコ
    アデータ1及びスコアデータ2を用いて合成するスコア
    付き構造化画像データ合成手段とを備えたことを特徴と
    する構造化画像データ処理装置。
  15. 【請求項15】 文書画像データとその配置データから
    なる構造化画像データと、文書画像データ内部の複数の
    領域を示す領域データとからなる入力データを入力し、
    所定の分割情報により、前記文書画像データの分割する
    領域を決定する分割領域決定ステップと、前記分割する
    領域により、文書画像データを複数の文書画像データに
    分割する画像分割ステップと、前記分割された文書画像
    データをそれぞれ部分的に処理する画像処理ステップ
    と、処理前の前記配置データと前記文書画像データをそ
    れぞれ画像処理後のデータに置き換えて構造化画像デー
    タを更新する構造化画像更新ステップとを備えたことを
    特徴とする構造化画像データ処理プログラム。
  16. 【請求項16】 前記分割情報が、前記文書画像データ
    の減色処理後と処理前の差異により求めることを特徴と
    する請求項15記載の構造化画像データ処理プログラ
    ム。
  17. 【請求項17】 前記分割情報が、前記配置データもし
    くは前記領域データに付加されたスコアデータであるこ
    とを特徴とする請求項15記載の構造化画像データ処理
    プログラム。
  18. 【請求項18】 前記分割情報が、前記配置データもし
    くは前記領域データに付加されたスコアデータと、構造
    化画像データを伝送する伝送路の伝送容量とユーザリク
    エストであることを特徴とする請求項15記載の構造化
    画像データ処理プログラム。
  19. 【請求項19】 文書画像データとその配置データから
    なる構造化画像データと、文書画像データ内部の複数の
    領域を示す領域データと、領域データに付加されたテキ
    ストデータとからなる入力データを入力し、前記領域デ
    ータに付加されたテキストデータにより分割する領域を
    決定する分割領域決定ステップと、前記分割すべき領域
    により、前記文書画像データを複数の文書画像データに
    分割する画像分割ステップと、前記分割された文書画像
    に対応する領域データに付加されたテキストデータに分
    割された文書画像を置き換えるテキスト置換ステップ
    と、前記配置データと、前記文書画像データと、テキス
    トデータを置き換えて構造化画像データを更新する構造
    化画像更新ステップとを備えたことを特徴とする構造化
    画像データ処理プログラム。
  20. 【請求項20】 文書画像データ1とその配置データか
    らなる構造化画像データ1と、文書画像データ1内部の
    複数の領域を示す領域データ1とを備えた第1の入力デ
    ータと、文書画像データ2とその配置データからなる構
    造化画像データ2と、文書画像データ2内部の複数の領
    域を示す領域データ2とを備えた第2の入力データとを
    入力し、前記第2の入力データを参照しながら前記第1
    の入力データのうち更新すべき領域を分割すべき領域と
    して決定する分割領域決定ステップと、前記分割すべき
    領域により、前記文書画像データ1を複数の文書画像デ
    ータに分割する画像分割ステップと、前記分割により構
    造化画像データの更新を行う構造化画像データ更新ステ
    ップと、前記更新された構造化画像データと構造化画像
    データ2を合成する構造化画像データ合成ステップとを
    備えたことを特徴とする構造化画像データ処理プログラ
    ム。
  21. 【請求項21】 文書画像データ1とその配置データ1
    からなる構造化画像データ1と、前記画像データ1内部
    の複数の領域を示す領域データ1と、配置データ1もし
    くは領域データ1のひとつまたは複数に付加されたスコ
    アデータ1とを備えた第1の入力データと、文書画像デ
    ータ2とその配置データからなる構造化画像データ2
    と、文書画像データ2内部の複数の領域を示す領域デー
    タ2と、配置データ2もしくは領域データ2のひとつま
    たは複数に付加されたスコアデータ2とを備えた第2の
    入力データを入力し、前記第2の入力データを参照しな
    がら、前記第1の入力データのうち更新すべき領域を、
    分割すべき領域として決定するスコア付き分割領域決定
    ステップと、前記分割すべき領域により、前記文書画像
    データを複数の文書画像データに分割する画像分割ステ
    ップと、前記第1の入力データの分割による構造化画像
    データの更新を行う構造化画像データ更新ステップと、
    更新された構造化画像データ1と構造化画像データ2を
    前記スコアデータ1及びスコアデータ2を用いて合成す
    るスコア付き構造化画像データ合成ステップとを備えた
    ことを特徴とする構造化画像データ処理プログラム。
JP2000379878A 1999-12-17 2000-12-14 構造化画像データ処理方法及びその装置、並びに構造化画像データ処理プログラム Pending JP2001236517A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000379878A JP2001236517A (ja) 1999-12-17 2000-12-14 構造化画像データ処理方法及びその装置、並びに構造化画像データ処理プログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP11-359248 1999-12-17
JP35924899 1999-12-17
JP2000379878A JP2001236517A (ja) 1999-12-17 2000-12-14 構造化画像データ処理方法及びその装置、並びに構造化画像データ処理プログラム

Publications (1)

Publication Number Publication Date
JP2001236517A true JP2001236517A (ja) 2001-08-31

Family

ID=26580925

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000379878A Pending JP2001236517A (ja) 1999-12-17 2000-12-14 構造化画像データ処理方法及びその装置、並びに構造化画像データ処理プログラム

Country Status (1)

Country Link
JP (1) JP2001236517A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7623712B2 (en) 2005-06-09 2009-11-24 Canon Kabushiki Kaisha Image processing method and apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7623712B2 (en) 2005-06-09 2009-11-24 Canon Kabushiki Kaisha Image processing method and apparatus
US7936929B2 (en) 2005-06-09 2011-05-03 Canon Kabushiki Kaisha Image processing method and apparatus for removing noise from a document image

Similar Documents

Publication Publication Date Title
US6275849B1 (en) Communication system for electronic messages
CN100584022C (zh) 将文档、电子邮件附件和地图流传输到无线设备的方法和系统
CN107809492A (zh) 分享信息的生成方法和系统
CN103605452A (zh) 图像处理装置、以及图像处理方法
CN1138214C (zh) 用于图象数据关键区的优先传输和显示的方法和装置
JP2004310326A (ja) コンテンツ配信システム、コンテンツ配信装置、コンテンツ配信方法およびコンピュータ読み取り可能なデータ合成プログラム
CN105447902B (zh) 动画处理方法和装置
JP2009294801A (ja) Webページ配信システム
US20050185000A1 (en) Representative color selection apparatus and method, reduced color image production apparatus and method, and programs
JP2007006043A (ja) 電子メール配信サーバ装置及び電子メール配信方法
US8774557B2 (en) Mosaic image generation device, mosaic image generation method and mosaic image recording medium
EP1109124A2 (en) Method and apparatus for image data processing and computer program product used therein
JP2007052731A (ja) 検索装置及び検索プログラム
KR102312420B1 (ko) 빅데이터 기반 인공지능 학습을 이용한 디지털 광고 솔루션 제공 방법 및 장치
CN112118449B (zh) 一种图像压缩与解压缩的方法及装置
JP2001236517A (ja) 構造化画像データ処理方法及びその装置、並びに構造化画像データ処理プログラム
JP3768959B2 (ja) ファイル形式の互換性を持たせるための方法
KR102187232B1 (ko) 카메라를 통해 인식된 사물의 패턴 생성을 이용하여 사물의 정보를 로딩하는 프로그램
JP2002133414A (ja) 画像処理方法及びその装置、記憶媒体
US20130218895A1 (en) Method and Apparatuses for Selectively Accessing Data Elements in a Data Library
JP3987172B2 (ja) 対話型コミュニケーション端末装置
JP3927474B2 (ja) 画像生成装置、プログラム、及び、記録媒体
JP3585036B2 (ja) 画像生成方法
JP2022075326A (ja) プログラム、情報処理方法、情報処理装置、及び機会学習モデル生成方法
JP2000324331A (ja) 画像処理装置及びその方法