JPH11328377A - 文書解析装置 - Google Patents

文書解析装置

Info

Publication number
JPH11328377A
JPH11328377A JP14211698A JP14211698A JPH11328377A JP H11328377 A JPH11328377 A JP H11328377A JP 14211698 A JP14211698 A JP 14211698A JP 14211698 A JP14211698 A JP 14211698A JP H11328377 A JPH11328377 A JP H11328377A
Authority
JP
Japan
Prior art keywords
document
information
display area
component element
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP14211698A
Other languages
English (en)
Inventor
Hiroaki Takagi
宏明 高城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP14211698A priority Critical patent/JPH11328377A/ja
Publication of JPH11328377A publication Critical patent/JPH11328377A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 文書の中に色合いの対比が施されていること
を解析することのできる文書解析装置を提供する。 【解決手段】 部品要素読み込み部101及び部品要素
属性判定部102が複数の画像を文書から抽出し、大き
さ順序調査部106が抽出された画像から、表示領域が
最大の画像と、2番目に大きい画像と、3番目に大きい
画像とを選択し、大きさ割合算出部107及び大きさ割
合判定部108が2番目に大きい画像と、3番目に大き
い画像との表示領域の大きさの割合が所定の第1閾値以
上であるか否かを検出し、表示領域の大きさの割合が所
定の第1閾値以上であると検出されたことに基づいて、
明度情報調査部110、彩度情報調査部111、及び、
色相情報調査部112が最大の画像と、2番目に大きい
画像との間の色に関する情報の差を検出し、当該色に関
する情報の差が所定の第2閾値以上であることに基づい
て、当該文書に色合いの対比が施されていると解析す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書を解析する文
書解析装置に関し、特に、文書に色合いの対比が施され
ていることを解析する文書解析装置に関する。
【0002】
【従来の技術】近年、コンピュータの性能の向上や低価
格化等に伴って、コンピュータを使用して文書を作成す
ることが幅広く普及している。文書を作成する際には、
ユーザはできるだけ品質の良い文書を作成したいという
願望を持っている。文書の品質を向上させる方法として
は、文書にデザインを施すということが知られている。
【0003】文書に施す文書のデザインの種類のひとつ
に色合いの対比がある。この色合いの対比は、色を規定
する色相、明度、彩度の三要素のいずれかについて文書
中の画像等の部品要素間で大きく異ならせることによっ
て実現され、文書の印象を強調するデザインである。例
えば、色合いの対比の中には、部品要素の明度を大きく
異ならせることによって実現される明暗の対比というも
のがある。この明暗の対比は、文書中に明るい部分と暗
い部分を同時に用いることによって実現される。例え
ば、文書中に白っぽい写真と黒っぽい写真とを同時に配
置したり、文書中に白で塗りつぶされたイラストと黒で
塗りつぶされたイラストとを同時に配置するような場合
がこれに当てはまる。
【0004】ところで、文書のデザインに関してアマチ
ュアレベルの一般のユーザにとっては、デザイナが作成
するような品質の高いデザインの文書や、レイアウト事
典等に取り上げられているデザインの基本を押さえた文
書を独自に作成することは非常に難しい。そこで、ユー
ザは文書の品質を向上させるために、品質の高いデザイ
ンが施された既存の文書を、再利用する、あるいは、参
考にするといった方法を用いることがある。
【0005】この方法を用いる場合においては、既存の
文書をデザインの種類毎に分類して予め管理しておく、
あるいは、既存の文書を解析して所望するデザインが施
された文書を抽出することが必要となる。このようなこ
とを、ユーザ自身が直接行うとかなりの手間がかかって
しまうので、コンピュータ等の装置によって文書を自動
的に解析することが必要となる。既存の文書を解析する
方法としては、特開平7-168910号公報に記載された方法
がある。この方法では、画像データ形式の文書から複数
の文字領域を検出して、本文や表題やあらまし等の各項
目領域を識別する。また、既存の文書のレイアウトを評
価する方法としては、特開平8-255063号公報に記載され
た方法がある。この方法では、文字や図形や画像等が含
まれた文書の中の空白の領域の分散状態を調べてレイア
ウトの適切さを調べる。
【0006】
【発明が解決しようとする課題】しかしながら、上記し
た特開平7-168910号公報に記載された方法は、文書の文
字を対象にしたものであり、色合いの対比が文書に施さ
れているか否かを解析することはできない。また、上記
した特開平8-255063号公報に記された方法は、文書の中
の空白領域の分散状態を調べてレイアウトの適切さを調
べるものであり、色合いの対比が文書に施されているか
否かを解析することはできない。
【0007】また、これらの方法以外にも文書の内容を
解析する方法はあるが、文書の内容を認識するための領
域分割を行ったり、定型的な文書のフォーマットを抽出
する等といったものであり、いずれの方法によっても、
色合いの対比が文書に施されているか否かを解析するこ
とはできない。本発明は、上記した従来の事情に鑑みて
なされたもので、文書の中に色合いの対比が施されてい
ることを適切に解析することのできる文書解析装置を提
供することを目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するため
に、本発明の請求項1に係る文書解析装置は、複数の部
品要素によって構成された文書に色合いの対比が施され
ていることを解析する文書解析装置であって、解析対象
とする所定の属性を有する複数の部品要素を文書から抽
出する抽出手段と、抽出手段によって抽出された部品要
素から2つの部品要素を選択する選択手段と、選択手段
が選択した2つの部品要素間の色に関する情報の差を検
出する検出手段と、当該色に関する情報の差が所定の閾
値以上であることに基づいて、当該文書に色合いの対比
が施されていると解析する色合い対比解析手段とを備え
たことを特徴とする。
【0009】上記した文書解析装置では、抽出手段が解
析対象とする所定の属性を有する複数の部品要素を文書
から抽出し、選択手段が抽出手段によって抽出された部
品要素から2つの部品要素を選択し、検出手段が選択手
段が選択した2つの部品要素間の色に関する情報の差を
検出し、色合い対比解析手段が当該色に関する情報の差
が所定の閾値以上であることに基づいて、当該文書に色
合いの対比が施されていると解析する。
【0010】また、本発明の請求項2に係る文書解析装
置は、請求項1に記載した文書解析装置において、選択
手段は、表示領域が最大の部品要素と、表示領域が2番
目に大きい部品要素とを選択することを特徴とする。上
記した文書解析装置では、選択手段が、表示領域が最大
の部品要素と、表示領域が2番目に大きい部品要素とを
選択し、これら部品要素に基づいて文書に色合いの対比
が施されているか否かを解析する。
【0011】また、本発明の請求項3に係る文書解析装
置は、複数の部品要素によって構成された文書に色合い
の対比が施されていることを解析する文書解析装置であ
って、解析対象とする所定の属性を有する複数の部品要
素を文書から抽出する抽出手段と、抽出手段によって抽
出された部品要素から、表示領域が最大の部品要素と、
表示領域が2番目に大きい部品要素と、表示領域が3番
目に大きい部品要素とを選択する選択手段と、表示領域
が2番目に大きい部品要素と、表示領域が3番目に大き
い部品要素との表示領域の大きさの割合が所定の第1閾
値以上であるか否かを検出する大きさ割合判定手段と、
大きさ割合判定手段によって表示領域の大きさの割合が
所定の第1閾値以上であると検出されたことに基づい
て、表示領域が最大の部品要素と、表示領域が2番目に
大きい部品要素との間の色に関する情報の差を検出する
検出手段と、当該色に関する情報の差が所定の第2閾値
以上であることに基づいて、当該文書に色合いの対比が
施されていると解析する色合い対比解析手段とを備えた
ことを特徴とする。
【0012】上記した文書解析装置では、抽出手段が解
析対象とする所定の属性を有する複数の部品要素を文書
から抽出し、選択手段が抽出手段によって抽出された部
品要素から、表示領域が最大の部品要素と、表示領域が
2番目に大きい部品要素と、表示領域が3番目に大きい
部品要素とを選択し、大きさ割合判定手段が表示領域が
2番目に大きい部品要素と、表示領域が3番目に大きい
部品要素との表示領域の大きさの割合が所定の第1閾値
以上であるか否かを検出し、検出手段が大きさ割合判定
手段によって表示領域の大きさの割合が所定の第1閾値
以上であると検出されたことに基づいて、表示領域が最
大の部品要素と、表示領域が2番目に大きい部品要素と
の間の色に関する情報の差を検出し、色合い対比解析手
段が当該色に関する情報の差が所定の第2閾値以上であ
ることに基づいて、当該文書に色合いの対比が施されて
いると解析する。
【0013】
【発明の実施の形態】本発明の一実施の形態による文書
解析装置を図1乃至図11を用いて説明する。まず、本
実施の形態に係る文書解析装置の概略の構成を図1を参
照して説明する。本実施の形態の文書解析装置は、文書
の入力、生成、編集、及び解析等といった文書処理全般
を行う。文書解析装置は、ユーザによる操作に関する情
報や文書の素材に関する情報を取り込む情報入力部30
1と、情報入力部301が取り込んだ操作情報を記憶す
る操作情報記憶部302と、情報入力部301が取り込
んだ文書の素材情報、生成あるいは編集された文書を記
憶する文書情報記憶部303と、文書の生成あるいは編
集を行う文書情報編集部304と、生成あるいは編集さ
れた文書を表示する文書情報表示部305と、文書のデ
ザインを解析するデザイン情報解析部306と、文書の
デザインに関する解析結果を記憶するデザイン情報記憶
部307とを備えている。デザイン情報解析部306
は、デザインのひとつである色合いの対比を解析する色
対比情報解析部308を備えている。なお、他の種類の
デザインを解析する場合には、デザイン情報解析部30
6に、該当する種類のデザインを解析するための情報解
析部を用意すればよい。
【0014】次に、文書解析装置の色対比情報解析部3
08の構成を図2を参照して説明する。色対比情報解析
部308は、文書を構成する部品要素を読み込む部品要
素読み込み部101と、部品要素が解析対象とする所定
の属性であるか否かを判定する部品要素属性判定部10
2と、部品要素の数を調べ、当該部品要素数に応じて処
理を行う部品要素数判定部103と、部品要素の外形の
位置を算出する外形位置算出部104と、部品要素の大
きさを算出する大きさ算出部105と、部品要素の大き
さを調べる大きさ順序調査部106と、部品要素間の大
きさの割合を算出する大きさ割合算出部107と、大き
さの割合を予め設定した閾値と比較する大きさ割合判定
部108と、部品要素の色の情報を明度、彩度、色相の
形式の情報に変換する色情報変換部109と、明度の形
式の情報(以下、明度情報という。)を調べる明度情報
調査部110と、彩度の形式の情報(以下、彩度情報と
いう。)を調べる彩度情報調査部111と、色相の形式
の情報(以下、色相情報という。)を調べる色相情報調
査部112とを有している。
【0015】次に、明度情報調査部110、彩度情報調
査部111、色相情報調査部112の構成を図3を参照
して説明する。明度情報調査部110、彩度情報調査部
111、色相情報調査部112のそれぞれは、部品要素
の所定の色情報(明度、彩度、又は、色相)の平均値を
算出する平均値算出部201と、2つの部品要素間での
当該色情報の平均値の差分を算出する差分値算出部20
2と、差分値算出部202で算出された差分と、予め設
定された閾値とを比較し、色合いの対比があるか否かを
判定する差分値判定部203とを有している。なお、上
記した各部の詳細な機能については、後述する動作説明
において行うこととする。
【0016】ここで、特許請求の範囲にいう抽出手段
は、主に上記した部品要素読み込み部101及び部品要
素属性判定部102によって構成され、特許請求の範囲
にいう選択手段は、主に上記した大きさ順序調査部10
6によって構成され、特許請求の範囲にいう検出手段
は、主に上記した明度情報調査部110、彩度情報調査
部111、又は、色相情報調査部112によって構成さ
れ、特許請求の範囲にいう色合い対比解析手段は、主に
上記した明度情報調査部110、彩度情報調査部11
1、又は、色相情報調査部112によって構成され、請
求項3にいう大きさ割合判定手段は、主に上記した大き
さ算出部105、大きさ順序調査部106、大きさ割合
算出部107、及び、大きさ割合判定部108によって
構成される。
【0017】次に、文書情報記憶部303に記憶されて
いる解析対象となる文書の一例を図4を参照して説明す
る。この文書はアプリケーションソフトによって作成さ
れたデータ形式となっている。なお、スキャナ等から入
力したビットマップ画像形式の文書でも文書中の要素が
分割でき、要素の属性が識別できれば、解析対象とな
る。
【0018】この文書は、一番上に「季節便り」と表さ
れている文字属性のタイトルY1を有し、タイトルY1
の下には文字属性の文章Y2〜Y4を有し、同図中では
木が簡略表示されて表されている画像属性の写真Y5〜
Y7を有している。なお、上記したタイトルY1、文章
Y2〜Y4、写真Y5〜Y7の1つ1つが文書を構成す
る部品要素となっている。
【0019】一般に、文書中で目につく要因として、部
品要素の大きさがある。図4に示す文書に着目すると、
3つの写真が含まれているが、このなかでは、大きさの
大きい右上の写真Y5と左側の写真Y6との2つの画像
が目につきやすい。ここで、右上の写真Y5は、色の濃
い葉が繁った木がたくさん写っており、背景が暗く、全
体としてかなり暗くなっている一方、左側の写真Y6
は、葉のついていない枝木が数本写っているだけであ
り、更に、背景が明るいために、全体としてはかなり明
るくなっている。
【0020】したがって、文書を見る人には、明るさが
かなり異なる2つの写真が目につくこととなり、文書を
見る人に対して、写真Y5の暗さの印象が強く与えら
れ、また、写真Y6の明るさの印象が強く与えられるこ
とになる。これは、明るさがかなり異なる画像等を文書
に配置するといった明暗の対比が施されているからであ
る。上記した文書の例では、色合いの対比として明暗の
対比が施された文書を例に上げたが、色合いの対比に
は、例えば、赤を多く含む画像と、緑を多く含む他の画
像といった色相がかなり異なる画像を文書に配置すると
いった色相の対比や、色の鮮やかさがかなり異なる画像
を文書に配置するといった彩度の対比がある。本実施の
形態に係る文書解析装置においては、基本的には、上記
したような色相、彩度、明度がかなり異なった状況が文
書中に現れるか否かを解析することによって色合いの対
比が文書に施されていることを解析する。
【0021】次に、本実施の形態に係る文書解析装置の
動作について説明する。まず、文書解析装置による文書
の入力、生成、編集等の動作を簡単に説明する。この文
書解析装置では、情報入力部301がユーザから編集等
における操作情報や、文書の素材情報を取り込み、操作
情報であれば操作情報記憶部302に記憶させ、文書の
素材情報であれば文書情報記憶部303に記憶させる。
そして、文書情報編集部304が操作情報記憶部302
に記憶された操作情報に基づいて、該当する文書等を文
書情報記憶部303から取り出して文書の生成や編集を
行い、生成や編集を行った文書を文書情報記憶部303
に格納する。文書の生成や編集の際には、文書情報表示
部305が生成や編集の対象となっている文書を表示す
る。また、この文書解析装置では、デザイン情報解析部
306が文書情報記憶部303に記憶されている文書に
施されているデザインの解析を行う。文書に色合いの対
比が施されているか否かの解析は、デザイン情報解析部
306の色対比情報解析部308によって後述するよう
に解析される。そして、デザイン情報解析部306によ
る文書のデザインに関する解析結果はデザイン情報記憶
部307に記憶される。
【0022】次に、文書解析装置の色対比情報解析部3
08によって行われる文書に色合いの対比が施されてい
るか否かを解析する処理の動作を図5乃至図11を参照
して説明する。文書に色合いの対比が施されているか否
かを解析する処理全体の流れを図5を参照して説明す
る。まず、文書を構成する部品要素の中から画像属性を
有する部品要素(以下、画像部品要素という)を取り出
し、当該画像部品要素から大きさの大きい2つの画像部
品要素(注目画像部品要素)を抽出する後述する注目画
像部品要素の抽出処理を行い(ステップS101)、2
つの注目画像部品要素間で色の情報の差を求め、その差
を予め設定された閾値と比較することにより、色合いの
対比が文書に施されているか否かを解析する後述する色
情報の調査処理を行う(ステップS102)。
【0023】次に、注目画像部品要素の抽出処理(ステ
ップS101)を図6を参照して詳細に説明する。ま
ず、部品要素読み込み部101が文書情報記憶部303
に記憶されている文書から部品要素を読み込み、部品要
素属性判定部102が読み込んだ部品要素の属性を調べ
て、画像部品要素を選び出す(ステップS201)。こ
こで、属性とは、文字、画像、図形等といった部品要素
の種類をいう。次いで、部品要素数判定部103が選び
出した画像部品要素の数を調べ(ステップS202)、
画像部品要素の数が2個以上であるか否かを検出する
(ステップS203)。ここで、この2個という数は、
色合いの対比を表現するために最低限必要な画像部品要
素の数である。
【0024】この結果、画像部品要素が2個以上である
場合には、文書に色合いの対比が施されている可能性が
あることを意味している。この場合には、外形位置算出
部104が選び出した画像部品要素の外形の位置を求め
る(ステップS204)。ここで外形とは、画像部品要
素の輪郭の形状が矩形であればその矩形をいい、画像部
品要素の輪郭の形状が矩形以外の場合には、画像部品要
素に外接する矩形をいう。そして、外形の位置とは、矩
形の端部の位置をいう。次いで、大きさ算出部105が
画像部品要素の外形の大きさを算出する(ステップS2
05)。ここで、部品要素の大きさとしては、外形の幅
や高さ等を用いることもできるが、本実施の形態では、
面積を用いている。
【0025】そして、大きさ順序調査部106が画像部
品要素の面積の大きさの順番を整理する(ステップS2
06)。図7には、図4に示す文書の画像部品要素を画
像部品要素の大きさについて整理したグラフを示してい
る。同図では、横軸を面積の大きさにとっている。な
お、面積の単位は、画像部品要素間で統一されていれば
どのような単位であってもよく、これについては、ここ
では特に明記しない。図7に示すA1は、図4に示す写
真Y6に対応し、A2は、図4に示す写真Y5に対応
し、A3は、図4に示す写真Y7に対応しており、面積
の値は順に、88、63、20となっている。
【0026】この後、大きさ順序調査部106が大きさ
の大きい方から順に2つの画像部品要素(注目画像部品
要素)を抽出する(ステップS207)。図4に示す文
書では、写真Y6と、写真Y5とが注目画像部品要素と
して抽出される。次いで、大きさ割合算出部107が3
番目に大きい画像部品要素の面積に対する2番目に大き
い注目画像部品要素の面積の割合を算出する。図4に示
す文書では、2番目に大きい注目画像部品要素は写真Y
5であり、3番目に大きい画像部品要素は写真Y7であ
り、この場合には、面積の割合は63/20で、約3.
2と算出される。
【0027】そして、大きさ割合判定部108が算出さ
れた面積の割合と予め設定された閾値とを比較し(ステ
ップS209)、面積の割合が閾値以上か否かを検出す
る(ステップS210)。この比較処理(ステップS2
09)では、2つの注目画像部品要素の大きさが他の画
像部品要素に比べてかなり大きいか否かを判断すること
によって、文書が与える色合いの印象において、注目画
像部品要素が大きな影響を及ぼすか否かを判断してい
る。ここで、閾値としては、任意の値(例えば、3)を
設定することができる。
【0028】閾値との比較の結果、面積の割合が閾値以
上の場合には、注目画像部品要素間の色合いの印象が文
書の色合いの印象として把握されることを意味している
ので、注目画像部品要素の抽出処理を終了し、注目画像
部品要素間の色情報を調査する後続する処理(図5に示
すステップS102)を実行する。なお、文書中の画像
部品要素の数が2つの場合には、処理(ステップS20
8〜S210)は行われずに、注目画像部品要素の抽出
処理を終了し、注目画像部品要素間の色情報を調査する
後続する処理(図5に示すステップS102)を実行す
る。例えば、図4に示す文書であれば、面積の割合が
3.2であるので閾値が3と設定されている場合には、
閾値以上と検出され、注目画像部品要素間の色情報を調
査する後続する処理(図5に示すステップS102)が
実行される。
【0029】一方、文書中に画像部品要素の数が0又は
1個の場合(ステップS203)、あるいは、面積の割
合が閾値より小さいと検出された場合(ステップS21
0)には、色合いの対比というデザインが使用されてい
ないことを意味しているので、部品要素数判定部103
あるいは大きさ割合判定部108が文書に色合いの対比
が施されていないという情報をデザイン情報記憶部30
7に記憶し(ステップS211)、後続の処理(図5に
示すステップS102)を実行せずに当該文書に対する
解析に関する全ての処理を終了する。
【0030】次に、色情報の調査処理(ステップS10
2)を図8を参照して詳細に説明する。まず、色情報変
換部109が2つの注目画像部品要素の色の情報を明
度、彩度、及び色相の形式に変換する(ステップS30
1)。例えば、画像データとして一般的なRGB形式の
画像データを、明度情報、彩度情報、色相情報に変換す
る。明度情報、彩度情報、色相情報の単位は限定しない
が、本実施の形態では、明度情報は0〜1の値をとり、
彩度情報は0〜1の値をとり、色相情報は0度〜360
度の値をとるものとする。
【0031】次いで、明度情報調査部110が後述する
明度情報の調査処理(ステップS302)を行い、当該
明度情報の調査処理の結果に基づいて、明度情報調査部
110の差分値判定部203が明度の対比があるか否か
を解析し(ステップS303)、更に、彩度情報調査部
111が後述する彩度情報の調査処理(ステップS30
4)を行い、当該彩度情報の調査処理の結果に基づい
て、彩度情報調査部111の差分値判定部203が彩度
の対比があるか否かを解析し(ステップS305)、更
に、色相情報調査部112が後述する色相情報の調査処
理(ステップS306)を行い、当該色相情報の調査処
理の結果に基づいて、色相情報調査部112の差分値判
定部203が色相の対比があるか否かを解析する(ステ
ップS307)。
【0032】この結果、明度の対比、彩度の対比、色相
の対比のいずれかがあると解析された場合には、該当す
る情報調査部110〜112が、文書に色合いの対比が
施されているという情報をデザイン情報記憶部307に
記憶する(ステップS308)。なお、いずれの対比も
ないと解析された場合には、色相情報調査部112が文
書に色合いの対比が施されていないという情報をデザイ
ン情報記憶部307に記憶する。
【0033】次に、明度情報の調査処理(ステップS3
02)を図9を参照して説明する。まず、明度情報調査
部110の平均値算出部201が、2つの注目画像部品
要素のうちの1方の注目画像部品要素を選択し(ステッ
プS401)、選択した注目画像部品要素の全画素の明
度情報の値を調べて、これらの平均値を算出する(ステ
ップS402)。次いで、平均値算出部201が注目画
像部品要素の他方の注目画像部品要素を選択し(ステッ
プS403)、選択した注目画像部品要素の全画素の明
度情報の値を調べて、これらの平均値を算出する(ステ
ップS404)。この後、差分値算出手段202が既に
算出した2つの注目画像部品要素の明度情報の平均値の
差分を算出する(ステップS405)。
【0034】図10には、図4に示す文書の注目画像部
品要素である写真Y5の明度情報のヒストグラムを示し
ている。図11には、ヒストグラムの値に基づいて求め
られた2つの注目画像部品要素の明度情報の平均値を示
している。同図中において、M1は、図4に示す文書の
写真Y5に対応し、明度情報の平均値は約0.8と算出
されており、M2は、図4に示す文書の写真Y6に対応
し、明度情報の平均値は約0.2と算出されている。そ
して、この文書については、上記した処理(ステップS
405)において、平均値の差分は約0.6と算出され
る。
【0035】次いで、差分値判定部203が平均値の差
分値と閾値とを比較し(ステップS406)、平均値の
差分値が閾値以上か否かを検出する(ステップS40
7)。この処理(ステップS406、S407)では、
2つの注目画像部品要素の間の明度の差がかなり大きい
といった明暗の対比が施されている状態であるか否かを
検出している。ここで、閾値は任意の値(例えば、0.
5等)に設定でき、この値は経験的に求めることができ
る。なお、本実施の形態では、処理が始まる前に予め設
定しておくようにしているが、処理の途中に再設定する
ようにしてもよい。
【0036】この結果、差分値が閾値以上であると検出
された場合には、差分判定部203が文書に色合いの対
比が施されていると解析する一方、差分値が閾値より小
さい場合には、差分判定部203が色合いの対比が施さ
れていないと解析する。図4に示す文書については、差
分値は約0.6なので、閾値が0.5である場合には、色
合いの対比が施されていると解析される。なお、本実施
の形態では、注目画像部品要素の全画素の明度情報の平
均値を用いて、注目画像部品要素間の明度情報の差を算
出するようにしているが、例えば、注目画像部品要素に
ついてのヒストグラムの最も画素数が多いところの明度
を用いて、注目画像部品要素間の明度情報の差を算出す
るようにしてもよい。
【0037】次に、彩度情報の調査処理(ステップS3
04)について説明する。この彩度情報の調査処理で
は、彩度情報調査部111が彩度情報に対して、上記し
た明度情報の調査処理(ステップS302)と同様な処
理を実行する。なお、比較において使用する閾値につい
ては、任意の値(例えば、0.5等)に設定でき、この
値は経験的に求めることができる。そして、上記した明
度情報の調査処理と同じ値を用いる必要はなく、文書に
彩度の対比が施されていると判断できる値、すなわち、
注目画像部品要素間の彩度情報の差がかなり大きいこと
を判断できる値であればよい。
【0038】次に、色相情報の調査処理(ステップS3
06)について説明する。この色相情報の調査処理で
は、色相情報調査部112が色相情報に対して、上記し
た明度情報の調査処理(ステップS302)と同様な処
理を実行する。色相情報は、0度〜360度の角度を取
り、0度と360度とは同じ色相を表しており、0度と
360度とは連続している。そこで、色相情報の調査処
理では、2つの色相情報の差分としては、近い方の角度
を用いている。例えば、色相情報の値が10度と350
度である場合には、差分は20度となる。なお、比較に
おいて使用する閾値については、文書に色相の対比が施
されていると判断できる値、すなわち、注目画像部品要
素間の色相情報の差がかなり大きいことを判断できる値
であれば、任意の値(例えば、90度等)に設定でき、
この値は経験的に求めることができる。
【0039】このように、上記した処理によると、文書
に色合い対比が施されているか否かといったことが解析
され、解析結果がデザイン情報記憶部307に記憶され
る。したがって、ユーザは、デザイン情報記憶部307
の解析結果を利用することによって、色合いの対比が施
されている文書を容易に特定して利用することができ
る。
【0040】なお、上記した実施の形態では、文書の中
の画像部品要素を対象に色合いの対比を解析するように
していたが、視覚的に塊としてとらえられ、色情報を有
するイラストや図形等といった部品要素を対象に色合い
の対比を解析するようにしてもよい。
【0041】
【発明の効果】以上説明したように、本発明に係る文書
解析装置によれば、色合いの対比が施されている文書が
満たすべき条件に基づいて文書を解析するようにしたた
めに、既存の文書の中に色合いの対比が施されているこ
とを容易に解析することができる。
【図面の簡単な説明】
【図1】 本発明の一実施の形態に係る文書解析装置の
構成図である。
【図2】 本発明の一実施の形態に係る文書解析装置の
色対比情報解析部の構成図である。
【図3】 本発明の一実施の形態に係る明度情報調査
部、彩度情報調査部、色相情報調査部の構成図である。
【図4】本発明の一実施の形態に係る文書の一例を説明
する図である。
【図5】本発明の一実施の形態に係る文書に色合いの対
比が施されているか否かを解析する処理全体のフローチ
ャートである。
【図6】本発明の一実施の形態に係る注目画像部品要素
の抽出処理のフローチャートである。
【図7】本発明の一実施の形態に係る画像部品要素の大
きさを示したグラフである。
【図8】本発明の一実施の形態に係る色情報の調査処理
のフローチャートである。
【図9】本発明の一実施の形態に係る明度情報の調査処
理のフローチャートである。
【図10】本発明の一実施の形態に係る画像部品要素の
明度情報のヒストグラムのグラフである。
【図11】本発明の一実施の形態に係る像部品要素の明
度情報の平均値のグラフである。
【符号の説明】
101・・部品要素読み込み部、 102・・部品要
素属性判定部、103・・部品要素数判定部、 1
04・・外形位置算出部、105・・大きさ算出部、
106・・大きさ順序調査部、107・・大き
さ割合算出部、 108・・大きさ割合判定部、1
09・・色情報変換部、 110・・明度情報
調査部、111・・彩度情報調査部、 112・
・色相情報調査部、201・・平均値算出部、
202・・差分値算出部、203・・差分値判定部、
301・・情報入力部、302・・操作情報
記憶部、 303・・文書情報記憶部、304・
・文書情報編集部、 305・・文書情報表示
部、306・・デザイン情報解析部、 307・・デ
ザイン情報記憶部、308・・色対比情報解析部。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】複数の部品要素によって構成された文書に
    色合いの対比が施されていることを解析する文書解析装
    置であって、 解析対象とする所定の属性を有する複数の部品要素を文
    書から抽出する抽出手段と、 抽出手段によって抽出された部品要素から2つの部品要
    素を選択する選択手段と、 選択手段が選択した2つの部品要素間の色に関する情報
    の差を検出する検出手段と、 当該色に関する情報の差が所定の閾値以上であることに
    基づいて、当該文書に色合いの対比が施されていると解
    析する色合い対比解析手段とを備えたことを特徴とする
    文書解析装置。
  2. 【請求項2】請求項1に記載した文書解析装置におい
    て、 前記選択手段は、表示領域が最大の部品要素と、表示領
    域が2番目に大きい部品要素とを選択することを特徴と
    する文書解析装置。
  3. 【請求項3】複数の部品要素によって構成された文書に
    色合いの対比が施されていることを解析する文書解析装
    置であって、 解析対象とする所定の属性を有する複数の部品要素を文
    書から抽出する抽出手段と、 抽出手段によって抽出された部品要素から、表示領域が
    最大の部品要素と、表示領域が2番目に大きい部品要素
    と、表示領域が3番目に大きい部品要素とを選択する選
    択手段と、 表示領域が2番目に大きい部品要素と、表示領域が3番
    目に大きい部品要素との表示領域の大きさの割合が所定
    の第1閾値以上であるか否かを検出する大きさ割合判定
    手段と、 大きさ割合判定手段によって表示領域の大きさの割合が
    所定の第1閾値以上であると検出されたことに基づい
    て、表示領域が最大の部品要素と、表示領域が2番目に
    大きい部品要素との間の色に関する情報の差を検出する
    検出手段と、 当該色に関する情報の差が所定の第2閾値以上であるこ
    とに基づいて、当該文書に色合いの対比が施されている
    と解析する色合い対比解析手段とを備えたことを特徴と
    する文書解析装置。
JP14211698A 1998-05-08 1998-05-08 文書解析装置 Pending JPH11328377A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14211698A JPH11328377A (ja) 1998-05-08 1998-05-08 文書解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14211698A JPH11328377A (ja) 1998-05-08 1998-05-08 文書解析装置

Publications (1)

Publication Number Publication Date
JPH11328377A true JPH11328377A (ja) 1999-11-30

Family

ID=15307790

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14211698A Pending JPH11328377A (ja) 1998-05-08 1998-05-08 文書解析装置

Country Status (1)

Country Link
JP (1) JPH11328377A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011145257A1 (ja) 2010-05-20 2011-11-24 日本電気株式会社 配色検査装置、そのコンピュータプログラムおよびデータ処理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011145257A1 (ja) 2010-05-20 2011-11-24 日本電気株式会社 配色検査装置、そのコンピュータプログラムおよびデータ処理方法
US9336608B2 (en) 2010-05-20 2016-05-10 Nec Corporation Color arrangement checking device, information storage medium storing a computer program thereof, and data processing method

Similar Documents

Publication Publication Date Title
US6865290B2 (en) Method and apparatus for recognizing document image by use of color information
JP4016342B2 (ja) コード認識のための装置及びその方法
EP1840797B1 (en) Image processing apparatus, image processing method, and computer program used therewith
Greenfield et al. Image recoloring induced by palette color associations
EP1909484A1 (en) Image processing device, image processing program, and image processing method
CN101944179A (zh) 图像处理装置和图像处理方法
JP4208384B2 (ja) 画像変換方法および装置、ならびに画像変換プログラムを記録したコンピュータ読取可能な記録媒体
JP2018132953A (ja) 画像処理方法、及びコンピュータプログラム
US6744918B1 (en) Document analysis method to detect BW/color areas and corresponding scanning device
US20110187721A1 (en) Line drawing processing apparatus, storage medium storing a computer-readable program, and line drawing processing method
US20070237408A1 (en) Image processing apparatus and image processing method
JPH11328377A (ja) 文書解析装置
US7599556B2 (en) Apparatus, system, and method for scanning segmentation
JP2014071556A (ja) 画像処理装置、画像処理方法、及びプログラム
US9648208B2 (en) Method and apparatus and using an enlargement operation to reduce visually detected defects in an image
JP2005260452A (ja) 画像処理装置
JP2009230556A (ja) オブジェクト検出装置、オブジェクト検出方法、オブジェクト検出プログラムおよび印刷装置
JP2000209449A (ja) カラ―マッチング方法および装置
EP0996080A2 (en) System and method for automatic region selection
JP2002236921A (ja) 文書画像認識方法、文書画像認識装置及び記録媒体
JP6694165B2 (ja) 画像処理装置、画像形成装置、画像処理方法及び画像処理プログラム
KR100917926B1 (ko) 썸네일 생성 시스템 및 생성 방법
KR100911059B1 (ko) 썸네일 생성 시스템 및 생성 방법
KR100916854B1 (ko) 썸네일 생성 시스템 및 생성 방법
CN102710887B (zh) 图像处理装置及图像处理方法