JPH10198705A - 文書画像処理装置および文書画像処理方法および情報記録媒体 - Google Patents
文書画像処理装置および文書画像処理方法および情報記録媒体Info
- Publication number
- JPH10198705A JPH10198705A JP9017605A JP1760597A JPH10198705A JP H10198705 A JPH10198705 A JP H10198705A JP 9017605 A JP9017605 A JP 9017605A JP 1760597 A JP1760597 A JP 1760597A JP H10198705 A JPH10198705 A JP H10198705A
- Authority
- JP
- Japan
- Prior art keywords
- document image
- size
- image
- type
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 レイアウト構造や論理構造の類似した文書画
像(例えば複数の異なる新聞社の新聞の記事の一部)を
も、自動的に分類することの可能な文書画像処理装置お
よび文書画像処理方法および情報記録媒体を提供する。 【解決手段】 文書画像中に含まれている各文字画像の
書体を識別し、文書画像中の文字画像の書体の種類およ
び書体の種類数を検出する書体識別手段11と、書体識
別手段11によって識別され検出された文書画像中の文
字画像の書体の種類および書体の種類数に基づいて文書
画像を所定のクラスに分類する文書画像分類手段13と
を有している。
像(例えば複数の異なる新聞社の新聞の記事の一部)を
も、自動的に分類することの可能な文書画像処理装置お
よび文書画像処理方法および情報記録媒体を提供する。 【解決手段】 文書画像中に含まれている各文字画像の
書体を識別し、文書画像中の文字画像の書体の種類およ
び書体の種類数を検出する書体識別手段11と、書体識
別手段11によって識別され検出された文書画像中の文
字画像の書体の種類および書体の種類数に基づいて文書
画像を所定のクラスに分類する文書画像分類手段13と
を有している。
Description
【0001】
【発明の属する技術分野】本発明は、文書画像処理を行
なう文書画像処理装置および文書画像処理方法および情
報記録媒体に関する。
なう文書画像処理装置および文書画像処理方法および情
報記録媒体に関する。
【0002】
【従来の技術】従来、電子図書館に代表されるように文
書画像を電子化し、分類・検索する需要は非常に大き
い。従来では、文書画像を分類する方式として、例えば
文献「画像の認識・理解シンポジウム(MIRU'96) 講演論
文集2 ページ295〜300」に示されるように、文書の論
理構造やレイアウト構造を抽出し、これらの構造が類似
しているもの同士でクラスを作り、分類する方法が知ら
れている。すなわち、この方式では、例えば論文、名
刺、新聞、帳票などクラスを予め設け、入力画像の論理
構造を抽出し、これらのいずれかのクラスに分類するも
のである。
書画像を電子化し、分類・検索する需要は非常に大き
い。従来では、文書画像を分類する方式として、例えば
文献「画像の認識・理解シンポジウム(MIRU'96) 講演論
文集2 ページ295〜300」に示されるように、文書の論
理構造やレイアウト構造を抽出し、これらの構造が類似
しているもの同士でクラスを作り、分類する方法が知ら
れている。すなわち、この方式では、例えば論文、名
刺、新聞、帳票などクラスを予め設け、入力画像の論理
構造を抽出し、これらのいずれかのクラスに分類するも
のである。
【0003】
【発明が解決しようとする課題】上述した従来の方式で
は、論文,名刺といった構造的な特徴が違うクラスへの
分類はある程度可能であるが、例えば新聞のA紙とB紙
を分類することは論理構造に有為な差があるとは言え
ず、事実上不可能であるという問題があった。
は、論文,名刺といった構造的な特徴が違うクラスへの
分類はある程度可能であるが、例えば新聞のA紙とB紙
を分類することは論理構造に有為な差があるとは言え
ず、事実上不可能であるという問題があった。
【0004】本発明は、従来の方法では分類が不可能で
あった、レイアウト構造や論理構造の類似した文書画像
(例えば複数の異なる新聞社の新聞の記事の一部)をも、
自動的に分類することの可能な文書画像処理装置および
文書画像処理方法および情報記録媒体を提供することを
目的としている。
あった、レイアウト構造や論理構造の類似した文書画像
(例えば複数の異なる新聞社の新聞の記事の一部)をも、
自動的に分類することの可能な文書画像処理装置および
文書画像処理方法および情報記録媒体を提供することを
目的としている。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、請求項1記載の発明は、文書画像中に含まれている
各文字画像の書体を識別し、文書画像中の文字画像の書
体の種類および書体の種類数を検出する書体識別手段
と、書体識別手段によって識別され検出された文書画像
中の文字画像の書体の種類および書体の種類数に基づい
て文書画像を所定のクラスに分類する文書画像分類手段
とを有していることを特徴としている。
に、請求項1記載の発明は、文書画像中に含まれている
各文字画像の書体を識別し、文書画像中の文字画像の書
体の種類および書体の種類数を検出する書体識別手段
と、書体識別手段によって識別され検出された文書画像
中の文字画像の書体の種類および書体の種類数に基づい
て文書画像を所定のクラスに分類する文書画像分類手段
とを有していることを特徴としている。
【0006】また、請求項2記載の発明は、文書画像中
に含まれている各文字画像のサイズを識別し、文書画像
中の文字画像のサイズの種類およびサイズの種類数を検
出するサイズ識別手段と、サイズ識別手段によって識別
され検出された文書画像中の文字画像のサイズの種類お
よびサイズの種類数に基づいて文書画像を所定のクラス
に分類する文書画像分類手段とを有していることを特徴
としている。
に含まれている各文字画像のサイズを識別し、文書画像
中の文字画像のサイズの種類およびサイズの種類数を検
出するサイズ識別手段と、サイズ識別手段によって識別
され検出された文書画像中の文字画像のサイズの種類お
よびサイズの種類数に基づいて文書画像を所定のクラス
に分類する文書画像分類手段とを有していることを特徴
としている。
【0007】また、請求項3記載の発明は、文書画像中
に含まれている各文字画像の書体を識別し、文書画像中
の文字画像の書体の種類および書体の種類数を検出する
書体識別手段と、文書画像中に含まれている各文字画像
のサイズを識別し、文書画像中の文字画像のサイズの種
類およびサイズの種類数を検出するサイズ識別手段と、
前記書体識別手段によって識別され検出された文書画像
中の文字画像の書体の種類および書体の種類数と前記サ
イズ識別手段によって識別され検出された文書画像中の
文字画像のサイズの種類およびサイズの種類数とに基づ
いて文書画像を所定のクラスに分類する文書画像分類手
段とを有していることを特徴としている。
に含まれている各文字画像の書体を識別し、文書画像中
の文字画像の書体の種類および書体の種類数を検出する
書体識別手段と、文書画像中に含まれている各文字画像
のサイズを識別し、文書画像中の文字画像のサイズの種
類およびサイズの種類数を検出するサイズ識別手段と、
前記書体識別手段によって識別され検出された文書画像
中の文字画像の書体の種類および書体の種類数と前記サ
イズ識別手段によって識別され検出された文書画像中の
文字画像のサイズの種類およびサイズの種類数とに基づ
いて文書画像を所定のクラスに分類する文書画像分類手
段とを有していることを特徴としている。
【0008】また、請求項4記載の発明は、文書画像中
に含まれている各文字画像の書体および/またはサイズ
を識別し、文書画像中の文字画像の書体の種類および書
体の種類数、および/または、文書画像中の文字画像の
サイズの種類およびサイズの種類数を検出し、識別され
検出された書体の種類および書体の種類数、および/ま
たは、サイズの種類およびサイズの種類数に基づいて文
書画像を所定のクラスに分類することを特徴としてい
る。
に含まれている各文字画像の書体および/またはサイズ
を識別し、文書画像中の文字画像の書体の種類および書
体の種類数、および/または、文書画像中の文字画像の
サイズの種類およびサイズの種類数を検出し、識別され
検出された書体の種類および書体の種類数、および/ま
たは、サイズの種類およびサイズの種類数に基づいて文
書画像を所定のクラスに分類することを特徴としてい
る。
【0009】また、請求項5記載の発明は、文書画像中
に含まれている各文字画像の書体および/またはサイズ
を識別し、文書画像中の文字画像の書体の種類および書
体の種類数、および/または、文書画像中の文字画像の
サイズの種類およびサイズの種類数を検出し、識別され
検出された書体の種類および書体の種類数、および/ま
たは、サイズの種類およびサイズの種類数に基づいて文
書画像を所定のクラスに分類するためのプログラムが記
録されていることを特徴としている。
に含まれている各文字画像の書体および/またはサイズ
を識別し、文書画像中の文字画像の書体の種類および書
体の種類数、および/または、文書画像中の文字画像の
サイズの種類およびサイズの種類数を検出し、識別され
検出された書体の種類および書体の種類数、および/ま
たは、サイズの種類およびサイズの種類数に基づいて文
書画像を所定のクラスに分類するためのプログラムが記
録されていることを特徴としている。
【0010】
【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。図1は本発明に係る文書画像処理装
置の構成例を示す図である。図1を参照すると、この文
書画像処理装置は、文書を例えば2値画像として読み込
む画像入力部1と、画像入力部1で読み込まれた文書画
像を記憶するメモリ2と、文書画像を見出し,本文,写
真,表などの領域に分割し、領域を識別する領域識別部
3と、領域識別部3で識別された領域の識別結果に基づ
き、文書画像から文字画像(文字画像の領域)のみを抽出
する文字切り出し処理部4と、文字切り出し処理部4に
より切り出された各文字画像の書体(フォント)および/
または大きさ(サイズ)を特徴量として抽出し、該特徴量
に基づいて、文書画像をいずれかのクラスに(例えば、
新聞のA紙かB紙かに)分類する文書画像分類部5と、
全体の制御を行なう制御部6と、分類結果を出力する結
果出力部7とを有している。
基づいて説明する。図1は本発明に係る文書画像処理装
置の構成例を示す図である。図1を参照すると、この文
書画像処理装置は、文書を例えば2値画像として読み込
む画像入力部1と、画像入力部1で読み込まれた文書画
像を記憶するメモリ2と、文書画像を見出し,本文,写
真,表などの領域に分割し、領域を識別する領域識別部
3と、領域識別部3で識別された領域の識別結果に基づ
き、文書画像から文字画像(文字画像の領域)のみを抽出
する文字切り出し処理部4と、文字切り出し処理部4に
より切り出された各文字画像の書体(フォント)および/
または大きさ(サイズ)を特徴量として抽出し、該特徴量
に基づいて、文書画像をいずれかのクラスに(例えば、
新聞のA紙かB紙かに)分類する文書画像分類部5と、
全体の制御を行なう制御部6と、分類結果を出力する結
果出力部7とを有している。
【0011】ここで、文字切り出し処理部4は、文書画
像から例えば図2に示すように1つの文字画像を切り出
すようになっている。すなわち、図2の例では、1つの
文字画像(図2の例では、文字「永」)は、文字の外接矩
形領域ARとして切り出される。
像から例えば図2に示すように1つの文字画像を切り出
すようになっている。すなわち、図2の例では、1つの
文字画像(図2の例では、文字「永」)は、文字の外接矩
形領域ARとして切り出される。
【0012】また、図3は図1の文書画像分類部5の第
1の構成例を示す図である。図3の例では、文書画像分
類部5は、文書画像中に含まれている各文字画像の書体
を識別し、文書画像中の文字画像の書体の種類(フォン
トタイプ)および書体の種類数(フォントタイプ数)を検
出する書体識別手段11と、書体識別手段11によって
識別され検出された文書画像中の文字画像の書体の種類
および書体の種類数に基づいて文書画像を所定のクラス
に分類する文書画像分類手段13とを有している。
1の構成例を示す図である。図3の例では、文書画像分
類部5は、文書画像中に含まれている各文字画像の書体
を識別し、文書画像中の文字画像の書体の種類(フォン
トタイプ)および書体の種類数(フォントタイプ数)を検
出する書体識別手段11と、書体識別手段11によって
識別され検出された文書画像中の文字画像の書体の種類
および書体の種類数に基づいて文書画像を所定のクラス
に分類する文書画像分類手段13とを有している。
【0013】図4,図5は図1の文書画像分類部5が図
3のように構成されている場合の処理動作例を説明する
ためのフローチャートである。図4,図5を参照する
と、先ず、ステップS101では、画像入力部1によ
り、処理対象である文字が記載された文書(例えば原稿)
を読込み、これを文書画像としてメモリ2内に取り込
む。次いで、ステップS102では、取り込んだ文書画
像に対して、領域識別部3によって、文書画像を見出
し,本文,写真,表などの領域に分割し、分割されたそ
れぞれの領域を見出し,本文,写真,表などに分類す
る。
3のように構成されている場合の処理動作例を説明する
ためのフローチャートである。図4,図5を参照する
と、先ず、ステップS101では、画像入力部1によ
り、処理対象である文字が記載された文書(例えば原稿)
を読込み、これを文書画像としてメモリ2内に取り込
む。次いで、ステップS102では、取り込んだ文書画
像に対して、領域識別部3によって、文書画像を見出
し,本文,写真,表などの領域に分割し、分割されたそ
れぞれの領域を見出し,本文,写真,表などに分類す
る。
【0014】次いで、ステップS103では、文字切り
出し処理部4は、ステップS102で見出し及び本文と
分類された領域の部分を文字画像の部分と判断し、文書
画像から文字画像の部分のみを抽出し、その外接矩形の
座標を求める文字矩形抽出処理を行なう。
出し処理部4は、ステップS102で見出し及び本文と
分類された領域の部分を文字画像の部分と判断し、文書
画像から文字画像の部分のみを抽出し、その外接矩形の
座標を求める文字矩形抽出処理を行なう。
【0015】しかる後、ステップS104では、文書画
像分類部5は、ステップS103で抽出された各文字画
像の書体(フォント)を識別する。これにより、文書画像
中に含まれている文字の書体の種類(例えば明朝体,ゴ
シック体,…など)を検出することができ、また、これ
によって、文書画像中に含まれている文字の書体の種類
数n(例えば3種類(n=3)など)を検出(計数)すること
ができる(ステップS105)。
像分類部5は、ステップS103で抽出された各文字画
像の書体(フォント)を識別する。これにより、文書画像
中に含まれている文字の書体の種類(例えば明朝体,ゴ
シック体,…など)を検出することができ、また、これ
によって、文書画像中に含まれている文字の書体の種類
数n(例えば3種類(n=3)など)を検出(計数)すること
ができる(ステップS105)。
【0016】このようにして、文書画像中にn種類の書
体(フォント)が存在することが検出されたとき、これら
n種類の書体(フォント)のそれぞれがすでに登録されて
いるか否かを次に調べるため、n種類の各書体(フォン
ト)に番号i(i=1〜n)を付し、ステップS106で
は、先ず、iを“1”に初期設定する。
体(フォント)が存在することが検出されたとき、これら
n種類の書体(フォント)のそれぞれがすでに登録されて
いるか否かを次に調べるため、n種類の各書体(フォン
ト)に番号i(i=1〜n)を付し、ステップS106で
は、先ず、iを“1”に初期設定する。
【0017】そして、ステップS107では、i番目の
書体(フォント)が既に登録されたものか否かを判定し、
i番目の書体(フォント)が登録されていないものである
ときには、ステップS108で、i番目の書体(フォン
ト)を新たな書体(フォント)として登録して、ステップ
S109に進む。
書体(フォント)が既に登録されたものか否かを判定し、
i番目の書体(フォント)が登録されていないものである
ときには、ステップS108で、i番目の書体(フォン
ト)を新たな書体(フォント)として登録して、ステップ
S109に進む。
【0018】これに対し、i番目の書体(フォント)が既
に登録されているものであれば、ステップS109へ進
む。ステップS109では、iを“1”だけインクリメ
ントし、ステップS110では、iがnよりも大きくな
ったか否かを判断する。この結果、iがnよりも大きく
ないときには、次の(i=i+1番目の)書体(フォント)
について、すでに登録されているか否かの判断処理を行
なうため、再びステップS107に戻る。
に登録されているものであれば、ステップS109へ進
む。ステップS109では、iを“1”だけインクリメ
ントし、ステップS110では、iがnよりも大きくな
ったか否かを判断する。この結果、iがnよりも大きく
ないときには、次の(i=i+1番目の)書体(フォント)
について、すでに登録されているか否かの判断処理を行
なうため、再びステップS107に戻る。
【0019】このようにして、n種類の書体(フォント)
のそれぞれについてステップS107〜S110の処理
を繰り返し行ない、ステップS110において、iがn
よりも大きくなったときには、ステップS111におい
て、この文書画像中に含まれている書体(フォント)の種
類と書体の種類数nとの組み合わせがすでに登録されて
いるか否かを判断し、この文書画像中に含まれている書
体(フォント)の種類と書体の種類数nとの組み合わせが
登録されていない場合には、ステップS112におい
て、この文書画像中に含まれている書体(フォント)の種
類と書体の種類数nとの組み合わせを登録する。そし
て、ステップS113では、ステップS112で新たに
登録した書体(フォント)の種類と書体の種類数nとの組
み合わせに対する文書クラスの名前を外部から入力する
か、または自動的に新たな文書クラスのインデックスを
決定し、ステップS114では新しい文書クラスを作成
する。そして、この場合、ステップS115では、ステ
ップS114で新たに作成した文書クラスに文書画像を
分類する(登録する)。
のそれぞれについてステップS107〜S110の処理
を繰り返し行ない、ステップS110において、iがn
よりも大きくなったときには、ステップS111におい
て、この文書画像中に含まれている書体(フォント)の種
類と書体の種類数nとの組み合わせがすでに登録されて
いるか否かを判断し、この文書画像中に含まれている書
体(フォント)の種類と書体の種類数nとの組み合わせが
登録されていない場合には、ステップS112におい
て、この文書画像中に含まれている書体(フォント)の種
類と書体の種類数nとの組み合わせを登録する。そし
て、ステップS113では、ステップS112で新たに
登録した書体(フォント)の種類と書体の種類数nとの組
み合わせに対する文書クラスの名前を外部から入力する
か、または自動的に新たな文書クラスのインデックスを
決定し、ステップS114では新しい文書クラスを作成
する。そして、この場合、ステップS115では、ステ
ップS114で新たに作成した文書クラスに文書画像を
分類する(登録する)。
【0020】このように、図1の文書画像分類部5が図
3のように構成されている場合、文書中で用いられてい
る文字の書体(フォント)の種類と書体(フォント)の種類
数とを特徴量として抽出し、文字の書体(フォント)の種
類と書体(フォント)の種類数とによって文書画像を識別
し、分類するので、従来では困難であったレイアウト構
造や論理構造が類似した文書画像でも高精度に効率よく
識別、分類ができる。
3のように構成されている場合、文書中で用いられてい
る文字の書体(フォント)の種類と書体(フォント)の種類
数とを特徴量として抽出し、文字の書体(フォント)の種
類と書体(フォント)の種類数とによって文書画像を識別
し、分類するので、従来では困難であったレイアウト構
造や論理構造が類似した文書画像でも高精度に効率よく
識別、分類ができる。
【0021】また、図6は図1の文書画像分類部5の第
2の構成例を示す図である。図6の例では、文書画像分
類部5は、文書画像中に含まれている各文字画像の大き
さ(サイズ)を識別し、文書画像中の文字画像の大きさ
(サイズ)の種類および大きさ(サイズ)の種類数を検出す
るサイズ識別手段41と、サイズ識別手段41によって
識別され検出された文書画像中の文字画像の大きさ(サ
イズ)の種類および大きさ(サイズ)の種類数に基づいて
文書画像を所定のクラスに分類する文書画像分類手段4
3とを有している。
2の構成例を示す図である。図6の例では、文書画像分
類部5は、文書画像中に含まれている各文字画像の大き
さ(サイズ)を識別し、文書画像中の文字画像の大きさ
(サイズ)の種類および大きさ(サイズ)の種類数を検出す
るサイズ識別手段41と、サイズ識別手段41によって
識別され検出された文書画像中の文字画像の大きさ(サ
イズ)の種類および大きさ(サイズ)の種類数に基づいて
文書画像を所定のクラスに分類する文書画像分類手段4
3とを有している。
【0022】図7,図8は図1の文書画像分類部5が図
6のように構成されている場合の処理動作例を説明する
ためのフローチャートである。
6のように構成されている場合の処理動作例を説明する
ためのフローチャートである。
【0023】図7,図8を参照すると、先ず、ステップ
S201では、画像入力部1により、処理対象である文
字が記載された文書(例えば原稿)を読込み、これを文書
画像としてメモリ2内に取り込む。次いで、ステップS
202では、取り込んだ文書画像に対して、領域識別部
3によって、文書画像を見出し,本文,写真,表などの
領域に分割し、分割されたそれぞれの領域を見出し,本
文,写真,表などに分類する。
S201では、画像入力部1により、処理対象である文
字が記載された文書(例えば原稿)を読込み、これを文書
画像としてメモリ2内に取り込む。次いで、ステップS
202では、取り込んだ文書画像に対して、領域識別部
3によって、文書画像を見出し,本文,写真,表などの
領域に分割し、分割されたそれぞれの領域を見出し,本
文,写真,表などに分類する。
【0024】次いで、ステップS203では、文字切り
出し処理部4は、ステップS202で見出し及び本文と
分類された領域の部分を文字画像の部分と判断して、文
書画像から文字画像の部分のみを抽出し、その外接矩形
の座標を求める文字矩形抽出処理を行なう。
出し処理部4は、ステップS202で見出し及び本文と
分類された領域の部分を文字画像の部分と判断して、文
書画像から文字画像の部分のみを抽出し、その外接矩形
の座標を求める文字矩形抽出処理を行なう。
【0025】しかる後、ステップS204では、文書画
像分類部5は、ステップS203で抽出された各文字画
像の大きさ(サイズ)を識別する。これにより、文書画像
中に含まれている文字のサイズの種類を検出することが
でき、また、これによって、文書画像中に含まれている
文字のサイズの種類数m(例えば4種類(m=4)など)を
検出(計数)することができる(ステップS205)。
像分類部5は、ステップS203で抽出された各文字画
像の大きさ(サイズ)を識別する。これにより、文書画像
中に含まれている文字のサイズの種類を検出することが
でき、また、これによって、文書画像中に含まれている
文字のサイズの種類数m(例えば4種類(m=4)など)を
検出(計数)することができる(ステップS205)。
【0026】このようにして、文書画像中にm種類のサ
イズ(大きさ)の文字が存在することが検出されたとき、
これらm種類のサイズのそれぞれがすでに登録されてい
るか否かを次に調べるため、m種類の各サイズに番号j
(j=1〜m)を付し、ステップS206では、先ず、j
を“1”に初期設定する。
イズ(大きさ)の文字が存在することが検出されたとき、
これらm種類のサイズのそれぞれがすでに登録されてい
るか否かを次に調べるため、m種類の各サイズに番号j
(j=1〜m)を付し、ステップS206では、先ず、j
を“1”に初期設定する。
【0027】そして、ステップS207では、j番目の
サイズが既に登録されたものか否かを判定し、j番目の
サイズが登録されていないものであるときには、ステッ
プS208で、j番目のサイズを新たなサイズとして登
録して、ステップS209に進む。
サイズが既に登録されたものか否かを判定し、j番目の
サイズが登録されていないものであるときには、ステッ
プS208で、j番目のサイズを新たなサイズとして登
録して、ステップS209に進む。
【0028】これに対し、j番目のサイズが既に登録さ
れているものであれば、ステップS209へ進む。ステ
ップS209では、jを“1”だけインクリメントし、
ステップS210では、jがmよりも大きくなったか否
かを判断する。この結果、jがmよりも大きくないとき
には、次の(j=j+1番目の)サイズについて、すでに
登録されているか否かの判断処理を行なうため、再びス
テップS207に戻る。
れているものであれば、ステップS209へ進む。ステ
ップS209では、jを“1”だけインクリメントし、
ステップS210では、jがmよりも大きくなったか否
かを判断する。この結果、jがmよりも大きくないとき
には、次の(j=j+1番目の)サイズについて、すでに
登録されているか否かの判断処理を行なうため、再びス
テップS207に戻る。
【0029】このようにして、m種類のサイズのそれぞ
れについてステップS207〜S210の処理を繰り返
し行ない、ステップS210において、jがmよりも大
きくなったときには、ステップS211において、この
文書画像中に含まれているサイズの種類とサイズの種類
数mとの組み合わせがすでに登録されているか否かを判
断し、この文書画像中に含まれているサイズの種類とサ
イズの種類数mとの組み合わせが登録されていない場合
には、ステップS212において、この文書画像中に含
まれているサイズの種類とサイズの種類数mとの組み合
わせを登録する。そして、ステップS213では、ステ
ップS212で新たに登録したサイズの種類とサイズの
種類数mとの組み合わせに対する文書クラスの名前を外
部から入力するか、または自動的に新たな文書クラスの
インデックスを決定し、ステップS214では新しい文
書クラスを作成する。そして、この場合、ステップS2
15では、ステップS214で新たに作成した文書クラ
スに文書画像を分類する(登録する)。
れについてステップS207〜S210の処理を繰り返
し行ない、ステップS210において、jがmよりも大
きくなったときには、ステップS211において、この
文書画像中に含まれているサイズの種類とサイズの種類
数mとの組み合わせがすでに登録されているか否かを判
断し、この文書画像中に含まれているサイズの種類とサ
イズの種類数mとの組み合わせが登録されていない場合
には、ステップS212において、この文書画像中に含
まれているサイズの種類とサイズの種類数mとの組み合
わせを登録する。そして、ステップS213では、ステ
ップS212で新たに登録したサイズの種類とサイズの
種類数mとの組み合わせに対する文書クラスの名前を外
部から入力するか、または自動的に新たな文書クラスの
インデックスを決定し、ステップS214では新しい文
書クラスを作成する。そして、この場合、ステップS2
15では、ステップS214で新たに作成した文書クラ
スに文書画像を分類する(登録する)。
【0030】このように、図1の文書画像分類部5が図
6のように構成されている場合、文書中で用いられてい
る文字の大きさ(サイズ)の種類と大きさ(サイズ)の種類
数とを特徴量として抽出し、文字の大きさ(サイズ)の種
類と大きさ(サイズ)の種類数とによって文書画像を識別
し、分類するので、従来では困難であったレイアウト構
造や論理構造が類似した文書画像でも高精度に効率良く
識別、分類ができる。
6のように構成されている場合、文書中で用いられてい
る文字の大きさ(サイズ)の種類と大きさ(サイズ)の種類
数とを特徴量として抽出し、文字の大きさ(サイズ)の種
類と大きさ(サイズ)の種類数とによって文書画像を識別
し、分類するので、従来では困難であったレイアウト構
造や論理構造が類似した文書画像でも高精度に効率良く
識別、分類ができる。
【0031】また、図9は図1の文書画像分類部5の第
3の構成例を示す図である。図9の例では、文書画像分
類部5は、図3に示した第1の構成例の文書画像分類部
と図6に示した第2の構成例の文書画像分類部とを併せ
もち、文字画像の書体(フォント)と大きさ(サイズ)との
両方の情報を用いて文書画像を分類するようになってい
る。
3の構成例を示す図である。図9の例では、文書画像分
類部5は、図3に示した第1の構成例の文書画像分類部
と図6に示した第2の構成例の文書画像分類部とを併せ
もち、文字画像の書体(フォント)と大きさ(サイズ)との
両方の情報を用いて文書画像を分類するようになってい
る。
【0032】すなわち、図9の例では、文書画像分類部
5は、文書画像中に含まれている各文字画像の書体を識
別し、文書画像中の文字画像の書体の種類および書体の
種類数を検出する書体識別手段11と、文書画像中に含
まれている各文字画像の大きさ(サイズ)を識別し、文書
画像中の文字画像の大きさ(サイズ)の種類および大きさ
(サイズ)の種類数を検出するサイズ識別手段41と、書
体識別手段11によって識別された書体の種類および書
体の種類数とサイズ識別手段41によって識別された大
きさ(サイズ)の種類および大きさ(サイズ)の種類数とに
基づいて文書画像を所定のクラスに分類する文書画像分
類手段50とを有している。
5は、文書画像中に含まれている各文字画像の書体を識
別し、文書画像中の文字画像の書体の種類および書体の
種類数を検出する書体識別手段11と、文書画像中に含
まれている各文字画像の大きさ(サイズ)を識別し、文書
画像中の文字画像の大きさ(サイズ)の種類および大きさ
(サイズ)の種類数を検出するサイズ識別手段41と、書
体識別手段11によって識別された書体の種類および書
体の種類数とサイズ識別手段41によって識別された大
きさ(サイズ)の種類および大きさ(サイズ)の種類数とに
基づいて文書画像を所定のクラスに分類する文書画像分
類手段50とを有している。
【0033】図10,図11は図1の文書画像分類部5
が図9のように構成されている場合の処理動作例を説明
するためのフローチャートである。
が図9のように構成されている場合の処理動作例を説明
するためのフローチャートである。
【0034】図10,図11を参照すると、先ず、ステ
ップS301では、画像入力部1により、処理対象であ
る文字が記載された文書(例えば原稿)を読込み、これを
文書画像としてメモリ2内に取り込む。次いで、ステッ
プS302では、取り込んだ文書画像に対して、領域識
別部3によって、文書画像を見出し,本文,写真,表な
どの領域に分割し、分割されたそれぞれの領域を見出
し,本文,写真,表などに分類する。
ップS301では、画像入力部1により、処理対象であ
る文字が記載された文書(例えば原稿)を読込み、これを
文書画像としてメモリ2内に取り込む。次いで、ステッ
プS302では、取り込んだ文書画像に対して、領域識
別部3によって、文書画像を見出し,本文,写真,表な
どの領域に分割し、分割されたそれぞれの領域を見出
し,本文,写真,表などに分類する。
【0035】次いで、ステップS303では、文字切り
出し処理部4は、ステップS302で見出し及び本文と
分類された領域の部分を文字画像の部分と判断して、文
書画像から文字画像の部分のみを抽出し、その外接矩形
の座標を求める文字矩形抽出処理を行なう。
出し処理部4は、ステップS302で見出し及び本文と
分類された領域の部分を文字画像の部分と判断して、文
書画像から文字画像の部分のみを抽出し、その外接矩形
の座標を求める文字矩形抽出処理を行なう。
【0036】しかる後、ステップS304では、文書画
像分類部5は、ステップS303で抽出された各文字画
像の書体(フォント)を識別する。これにより、文書画像
中に含まれている文字の書体の種類(例えば明朝体,ゴ
シック体,…など)を検出することができ、また、これ
によって、文書画像中に含まれている文字の書体の種類
数n(例えば3種類(n=3)など)を検出(計数)すること
ができる(ステップS305)。このようにして、文書画
像中にn種類の書体(フォント)が存在することが検出さ
れたとき、これらn種類の書体(フォント)のそれぞれが
すでに登録されているか否かを次に調べるため、n種類
の各書体(フォント)に番号i(i=1〜n)を付し、ステ
ップS306では、先ず、iを“1”に初期設定する。
像分類部5は、ステップS303で抽出された各文字画
像の書体(フォント)を識別する。これにより、文書画像
中に含まれている文字の書体の種類(例えば明朝体,ゴ
シック体,…など)を検出することができ、また、これ
によって、文書画像中に含まれている文字の書体の種類
数n(例えば3種類(n=3)など)を検出(計数)すること
ができる(ステップS305)。このようにして、文書画
像中にn種類の書体(フォント)が存在することが検出さ
れたとき、これらn種類の書体(フォント)のそれぞれが
すでに登録されているか否かを次に調べるため、n種類
の各書体(フォント)に番号i(i=1〜n)を付し、ステ
ップS306では、先ず、iを“1”に初期設定する。
【0037】そして、ステップS307では、i番目の
書体(フォント)が既に登録されたものか否かを判定し、
i番目の書体(フォント)が登録されていないものである
ときには、ステップS308では、i番目の書体(フォ
ント)を新たな書体(フォント)として登録して、ステッ
プS309に進む。
書体(フォント)が既に登録されたものか否かを判定し、
i番目の書体(フォント)が登録されていないものである
ときには、ステップS308では、i番目の書体(フォ
ント)を新たな書体(フォント)として登録して、ステッ
プS309に進む。
【0038】これに対し、i番目の書体(フォント)が既
に登録されているものであれば、ステップS309へ進
む。ステップS309では、iを“1”だけインクリメ
ントし、ステップS310では、iがnよりも大きくな
ったか否かを判断する。この結果、iがnよりも大きく
ないときには、次の(i=i+1番目の)書体(フォント)
について、すでに登録されているか否かの判断処理を行
なうため、再びステップS307に戻る。
に登録されているものであれば、ステップS309へ進
む。ステップS309では、iを“1”だけインクリメ
ントし、ステップS310では、iがnよりも大きくな
ったか否かを判断する。この結果、iがnよりも大きく
ないときには、次の(i=i+1番目の)書体(フォント)
について、すでに登録されているか否かの判断処理を行
なうため、再びステップS307に戻る。
【0039】このようにして、n種類の各書体(フォン
ト)のそれぞれについてステップS307〜S310の
処理を繰り返し行ない、ステップS310において、i
がnよりも大きくなったときには、次に、ステップS3
11において、ステップS303で抽出された各文字画
像の大きさ(サイズ)を識別する。これにより、文書画像
中に含まれている文字のサイズの種類を検出することが
でき、また、これによって、文書画像中に含まれている
文字のサイズの種類数m(例えば4種類(m=4)など)を
検出(計数)することができる(ステップS312)。
ト)のそれぞれについてステップS307〜S310の
処理を繰り返し行ない、ステップS310において、i
がnよりも大きくなったときには、次に、ステップS3
11において、ステップS303で抽出された各文字画
像の大きさ(サイズ)を識別する。これにより、文書画像
中に含まれている文字のサイズの種類を検出することが
でき、また、これによって、文書画像中に含まれている
文字のサイズの種類数m(例えば4種類(m=4)など)を
検出(計数)することができる(ステップS312)。
【0040】このようにして、文書画像中にm種類のサ
イズ(大きさ)の文字が存在することが検出されたとき、
これらm種類のサイズのそれぞれがすでに登録されてい
るか否かを次に調べるため、m種類の各サイズに番号j
(j=1〜m)を付し、ステップS313では、先ず、j
を“1”に初期設定する。
イズ(大きさ)の文字が存在することが検出されたとき、
これらm種類のサイズのそれぞれがすでに登録されてい
るか否かを次に調べるため、m種類の各サイズに番号j
(j=1〜m)を付し、ステップS313では、先ず、j
を“1”に初期設定する。
【0041】そして、ステップS314では、j番目の
サイズが既に登録されたものか否かを判定し、j番目の
サイズが登録されていないものであるときには、ステッ
プS315では、j番目のサイズを新たなサイズとして
登録して、ステップS316に進む。
サイズが既に登録されたものか否かを判定し、j番目の
サイズが登録されていないものであるときには、ステッ
プS315では、j番目のサイズを新たなサイズとして
登録して、ステップS316に進む。
【0042】これに対し、j番目のサイズが既に登録さ
れているものであれば、ステップS316へ進む。ステ
ップS316では、jを“1”だけインクリメントし、
ステップS317では、jがmよりも大きくなったか否
かを判断する。この結果、jがmよりも大きくないとき
には、次の(j=j+1番目の)サイズについて、すでに
登録されているか否かの判断処理を行なうため、再びス
テップS314に戻る。
れているものであれば、ステップS316へ進む。ステ
ップS316では、jを“1”だけインクリメントし、
ステップS317では、jがmよりも大きくなったか否
かを判断する。この結果、jがmよりも大きくないとき
には、次の(j=j+1番目の)サイズについて、すでに
登録されているか否かの判断処理を行なうため、再びス
テップS314に戻る。
【0043】このようにして、m種類のサイズのそれぞ
れについてステップS314〜S317の処理を繰り返
し行ない、ステップS317において、jがmよりも大
きくなったときには、ステップS318において、ステ
ップS304,S305で識別し検出した書体(フォン
ト)の種類および書体の種類数とステップS311,S
312で識別し検出した大きさ(サイズ)の種類および大
きさ(サイズ)の種類数との組み合わせが既に登録された
ものか否かを判定し、既に登録されている場合には、ス
テップS322へ進み、文書画像を、ステップS30
4,S305で識別し検出した書体(フォント)の種類お
よび書体の種類数とステップS311,S312で識別
し検出した大きさ(サイズ)の種類および大きさ(サイズ)
の種類数との組み合わせに対応する文書クラスに分類す
る(登録する)。
れについてステップS314〜S317の処理を繰り返
し行ない、ステップS317において、jがmよりも大
きくなったときには、ステップS318において、ステ
ップS304,S305で識別し検出した書体(フォン
ト)の種類および書体の種類数とステップS311,S
312で識別し検出した大きさ(サイズ)の種類および大
きさ(サイズ)の種類数との組み合わせが既に登録された
ものか否かを判定し、既に登録されている場合には、ス
テップS322へ進み、文書画像を、ステップS30
4,S305で識別し検出した書体(フォント)の種類お
よび書体の種類数とステップS311,S312で識別
し検出した大きさ(サイズ)の種類および大きさ(サイズ)
の種類数との組み合わせに対応する文書クラスに分類す
る(登録する)。
【0044】これに対し、ステップS318において、
ステップS304,S305で識別し検出した書体(フ
ォント)の種類および書体の種類数とステップS31
1,S312で識別し検出した大きさ(サイズ)の種類お
よび大きさ(サイズ)の種類数との組み合わせが登録され
ていないものであるときには、ステップS319では、
ステップS304,S305で識別し検出した書体(フ
ォント)の種類および書体の種類数とステップS31
1,S312で識別し検出した大きさ(サイズ)の種類お
よび大きさ(サイズ)の種類数との組み合わせを新たな書
体(フォント)と大きさ(サイズ)の組み合わせとして登録
する。次いで、ステップS320では、ステップS31
9で新たに登録した書体(フォント)と大きさ(サイズ)の
組み合わせに対する文書クラスの名前を外部から入力す
るか、または自動的に新たな文書クラスのインデックス
を決定し、ステップS321では新しい文書クラスを作
成する。そして、この場合、ステップS322では、ス
テップS321で新たに作成した文書クラスに文書画像
を分類する(登録する)。
ステップS304,S305で識別し検出した書体(フ
ォント)の種類および書体の種類数とステップS31
1,S312で識別し検出した大きさ(サイズ)の種類お
よび大きさ(サイズ)の種類数との組み合わせが登録され
ていないものであるときには、ステップS319では、
ステップS304,S305で識別し検出した書体(フ
ォント)の種類および書体の種類数とステップS31
1,S312で識別し検出した大きさ(サイズ)の種類お
よび大きさ(サイズ)の種類数との組み合わせを新たな書
体(フォント)と大きさ(サイズ)の組み合わせとして登録
する。次いで、ステップS320では、ステップS31
9で新たに登録した書体(フォント)と大きさ(サイズ)の
組み合わせに対する文書クラスの名前を外部から入力す
るか、または自動的に新たな文書クラスのインデックス
を決定し、ステップS321では新しい文書クラスを作
成する。そして、この場合、ステップS322では、ス
テップS321で新たに作成した文書クラスに文書画像
を分類する(登録する)。
【0045】このように、図1の文書画像分類部5が図
9のように構成されている場合、文書中で用いられてい
る文字の書体(フォント)と大きさ(サイズ)とを組み合わ
せた情報を用いて文書画像を分類するので、さらに高精
度にあるいは詳細に分類することが可能となる。
9のように構成されている場合、文書中で用いられてい
る文字の書体(フォント)と大きさ(サイズ)とを組み合わ
せた情報を用いて文書画像を分類するので、さらに高精
度にあるいは詳細に分類することが可能となる。
【0046】図12は図1の文書画像処理装置のハード
ウェア構成例を示す図である。図12を参照すると、こ
の文書画像処理装置は、例えばパーソナルコンピュータ
等で実現され、全体を制御するCPU21と、CPU2
1の制御プログラム等が記憶されているROM22と、
CPU21のワークエリア等として使用されるRAM2
3と、文書を文書画像として読込むスキャナ24と、ス
キャナ24で読込まれた文書画像が例えばページ単位で
記憶される文書画像ファイル25と、文書画像に対し分
類を行なった結果を出力する結果出力装置(例えば、デ
ィスプレイやプリンタ)26とを有している。
ウェア構成例を示す図である。図12を参照すると、こ
の文書画像処理装置は、例えばパーソナルコンピュータ
等で実現され、全体を制御するCPU21と、CPU2
1の制御プログラム等が記憶されているROM22と、
CPU21のワークエリア等として使用されるRAM2
3と、文書を文書画像として読込むスキャナ24と、ス
キャナ24で読込まれた文書画像が例えばページ単位で
記憶される文書画像ファイル25と、文書画像に対し分
類を行なった結果を出力する結果出力装置(例えば、デ
ィスプレイやプリンタ)26とを有している。
【0047】ここで、スキャナ24,文書画像ファイル
25,結果出力装置26は、図1の画像入力部1,メモ
リ2,結果出力部7にそれぞれ対応している。また、C
PU21は、図1の制御部6,領域識別部3,文字切り
出し処理部4,文書画像分類部5の機能を有している。
25,結果出力装置26は、図1の画像入力部1,メモ
リ2,結果出力部7にそれぞれ対応している。また、C
PU21は、図1の制御部6,領域識別部3,文字切り
出し処理部4,文書画像分類部5の機能を有している。
【0048】なお、CPU21におけるこのような制御
部6,領域識別部3,文字切り出し処理部4,文書画像
分類部5等としての機能は、例えばソフトウェアパッケ
ージ(具体的には、CD−ROM等の情報記録媒体)の形
で提供することができ、このため、図9の例では、情報
記録媒体30がセットさせるとき、これを駆動する媒体
駆動装置31が設けられている。
部6,領域識別部3,文字切り出し処理部4,文書画像
分類部5等としての機能は、例えばソフトウェアパッケ
ージ(具体的には、CD−ROM等の情報記録媒体)の形
で提供することができ、このため、図9の例では、情報
記録媒体30がセットさせるとき、これを駆動する媒体
駆動装置31が設けられている。
【0049】換言すれば、本発明の文書画像処理装置
は、イメージスキャナ,ディスプレイ等を備えた汎用の
計算機システムにCD−ROM等の情報記録媒体に記録
されたプログラムを読み込ませて、この汎用計算機シス
テムのマイクロプロセッサに文書画像処理を実行させる
装置構成においても実施することが可能である。この場
合、本発明の文書画像処理を実行するためのプログラム
(すなわち、ハードウェアシステムで用いられるプログ
ラム)は、媒体に記録された状態で提供される。プログ
ラムなどが記録される情報記録媒体としては、CD−R
OMに限られるものではなく、ROM,RAM,フレキ
シブルディスク,メモリカード等が用いられても良い。
媒体に記録されたプログラムは、ハードウェアシステム
に組み込まれている記憶装置、例えばハードディスク装
置にインストールされることにより、このプログラムを
実行して、上述した本発明の文書画像処理機能を実現す
る文書画像処理装置の構築に寄与する。
は、イメージスキャナ,ディスプレイ等を備えた汎用の
計算機システムにCD−ROM等の情報記録媒体に記録
されたプログラムを読み込ませて、この汎用計算機シス
テムのマイクロプロセッサに文書画像処理を実行させる
装置構成においても実施することが可能である。この場
合、本発明の文書画像処理を実行するためのプログラム
(すなわち、ハードウェアシステムで用いられるプログ
ラム)は、媒体に記録された状態で提供される。プログ
ラムなどが記録される情報記録媒体としては、CD−R
OMに限られるものではなく、ROM,RAM,フレキ
シブルディスク,メモリカード等が用いられても良い。
媒体に記録されたプログラムは、ハードウェアシステム
に組み込まれている記憶装置、例えばハードディスク装
置にインストールされることにより、このプログラムを
実行して、上述した本発明の文書画像処理機能を実現す
る文書画像処理装置の構築に寄与する。
【0050】また、本発明の文書画像処理機能を実現す
るためのプログラムは、媒体の形で提供されるのみなら
ず、通信によって(例えばサーバによって)提供されるも
のであっても良い。
るためのプログラムは、媒体の形で提供されるのみなら
ず、通信によって(例えばサーバによって)提供されるも
のであっても良い。
【0051】以上のように、本発明によれば、識別のた
めの特徴量として、各文書に固有な文字の書体(フォン
ト)の種類とその種類数および/または大きさ(サイズ)
の種類とその種類数を用いるので、従来の方法ではほと
んど識別,分類できないと思われるレイアウト構造や論
理構造が類似した文書画像(例えば複数の異なる新聞社
の新聞の記事の一部)をも自動的に精度良く識別,分類
することが可能となり、文書画像の蓄積,検索等を行な
うのに大変有用である。
めの特徴量として、各文書に固有な文字の書体(フォン
ト)の種類とその種類数および/または大きさ(サイズ)
の種類とその種類数を用いるので、従来の方法ではほと
んど識別,分類できないと思われるレイアウト構造や論
理構造が類似した文書画像(例えば複数の異なる新聞社
の新聞の記事の一部)をも自動的に精度良く識別,分類
することが可能となり、文書画像の蓄積,検索等を行な
うのに大変有用である。
【0052】
【発明の効果】以上に説明したように、請求項1乃至請
求項5記載の発明によれば、識別のための特徴量とし
て、各文書に固有な文字の書体(フォント)の種類とその
種類数および/または大きさ(サイズ)の種類とその種類
数を用いるので、従来の方法では分類が不可能であっ
た、レイアウト構造や論理構造の類似した文書画像(例
えば複数の異なる新聞社の新聞の記事の一部)をも、自
動的に分類することができる。
求項5記載の発明によれば、識別のための特徴量とし
て、各文書に固有な文字の書体(フォント)の種類とその
種類数および/または大きさ(サイズ)の種類とその種類
数を用いるので、従来の方法では分類が不可能であっ
た、レイアウト構造や論理構造の類似した文書画像(例
えば複数の異なる新聞社の新聞の記事の一部)をも、自
動的に分類することができる。
【図1】本発明に係る文書画像処理装置の構成例を示す
図である。
図である。
【図2】1つの文字画像の一例を示す図である。
【図3】図1の文書画像分類部の第1の構成例を示す図
である。
である。
【図4】図1の文書画像分類部が図3のように構成され
ている場合の処理動作例を説明するためのフローチャー
トである。
ている場合の処理動作例を説明するためのフローチャー
トである。
【図5】図1の文書画像分類部が図3のように構成され
ている場合の処理動作例を説明するためのフローチャー
トである。
ている場合の処理動作例を説明するためのフローチャー
トである。
【図6】図1の文書画像分類部の第2の構成例を示す図
である。
である。
【図7】図1の文書画像分類部が図6のように構成され
ている場合の処理動作例を説明するためのフローチャー
トである。
ている場合の処理動作例を説明するためのフローチャー
トである。
【図8】図1の文書画像分類部が図6のように構成され
ている場合の処理動作例を説明するためのフローチャー
トである。
ている場合の処理動作例を説明するためのフローチャー
トである。
【図9】図1の文書画像分類部の第3の構成例を示す図
である。
である。
【図10】図1の文書画像分類部が図9のように構成さ
れている場合の処理動作例を説明するためのフローチャ
ートである。
れている場合の処理動作例を説明するためのフローチャ
ートである。
【図11】図1の文書画像分類部が図9のように構成さ
れている場合の処理動作例を説明するためのフローチャ
ートである。
れている場合の処理動作例を説明するためのフローチャ
ートである。
【図12】図1の文書画像処理装置のハードウェア構成
例を示す図である。
例を示す図である。
1 画像入力部 2 メモリ 3 領域識別部 4 文字切り出し処理部 5 文書画像分類部 6 制御部 7 結果出力部 21 CPU 22 ROM 23 RAM 24 スキャナ 25 文書画像ファイル 26 結果出力装置 30 情報記憶媒体 31 媒体駆動装置 11 書体識別手段 13 文書画像分類手段 41 サイズ識別手段 43 文書画像分類手段 50 文書画像分類手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 幸地 司 東京都大田区中馬込1丁目3番6号 株式 会社リコー内
Claims (5)
- 【請求項1】 文書画像中に含まれている各文字画像の
書体を識別し、文書画像中の文字画像の書体の種類およ
び書体の種類数を検出する書体識別手段と、書体識別手
段によって識別され検出された文書画像中の文字画像の
書体の種類および書体の種類数に基づいて文書画像を所
定のクラスに分類する文書画像分類手段とを有している
ことを特徴とする文書画像処理装置。 - 【請求項2】 文書画像中に含まれている各文字画像の
サイズを識別し、文書画像中の文字画像のサイズの種類
およびサイズの種類数を検出するサイズ識別手段と、サ
イズ識別手段によって識別され検出された文書画像中の
文字画像のサイズの種類およびサイズの種類数に基づい
て文書画像を所定のクラスに分類する文書画像分類手段
とを有していることを特徴とする文書画像処理装置。 - 【請求項3】 文書画像中に含まれている各文字画像の
書体を識別し、文書画像中の文字画像の書体の種類およ
び書体の種類数を検出する書体識別手段と、文書画像中
に含まれている各文字画像のサイズを識別し、文書画像
中の文字画像のサイズの種類およびサイズの種類数を検
出するサイズ識別手段と、前記書体識別手段によって識
別され検出された文書画像中の文字画像の書体の種類お
よび書体の種類数と前記サイズ識別手段によって識別さ
れ検出された文書画像中の文字画像のサイズの種類およ
びサイズの種類数とに基づいて文書画像を所定のクラス
に分類する文書画像分類手段とを有していることを特徴
とする文書画像処理装置。 - 【請求項4】 文書画像中に含まれている各文字画像の
書体および/またはサイズを識別し、文書画像中の文字
画像の書体の種類および書体の種類数、および/また
は、文書画像中の文字画像のサイズの種類およびサイズ
の種類数を検出し、識別され検出された書体の種類およ
び書体の種類数、および/または、サイズの種類および
サイズの種類数に基づいて文書画像を所定のクラスに分
類することを特徴とする文書画像処理方法。 - 【請求項5】 文書画像中に含まれている各文字画像の
書体および/またはサイズを識別し、文書画像中の文字
画像の書体の種類および書体の種類数、および/また
は、文書画像中の文字画像のサイズの種類およびサイズ
の種類数を検出し、識別され検出された書体の種類およ
び書体の種類数、および/または、サイズの種類および
サイズの種類数に基づいて文書画像を所定のクラスに分
類するためのプログラムが記録されていることを特徴と
する情報記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9017605A JPH10198705A (ja) | 1997-01-14 | 1997-01-14 | 文書画像処理装置および文書画像処理方法および情報記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9017605A JPH10198705A (ja) | 1997-01-14 | 1997-01-14 | 文書画像処理装置および文書画像処理方法および情報記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10198705A true JPH10198705A (ja) | 1998-07-31 |
Family
ID=11948524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9017605A Pending JPH10198705A (ja) | 1997-01-14 | 1997-01-14 | 文書画像処理装置および文書画像処理方法および情報記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH10198705A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003529122A (ja) * | 1999-07-02 | 2003-09-30 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マルチメディア情報に対するメタ・ディスクリプタ |
US7948664B2 (en) | 2006-08-24 | 2011-05-24 | Sharp Kabushiki Kaisha | Image processing method, image processing apparatus, document reading apparatus, image forming apparatus, computer program and recording medium |
-
1997
- 1997-01-14 JP JP9017605A patent/JPH10198705A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003529122A (ja) * | 1999-07-02 | 2003-09-30 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マルチメディア情報に対するメタ・ディスクリプタ |
US7948664B2 (en) | 2006-08-24 | 2011-05-24 | Sharp Kabushiki Kaisha | Image processing method, image processing apparatus, document reading apparatus, image forming apparatus, computer program and recording medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3282860B2 (ja) | 文書上のテキストのデジタル画像を処理する装置 | |
CA2078423C (en) | Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information | |
EP0544432B1 (en) | Method and apparatus for document processing | |
JP3232144B2 (ja) | 文章中の単語文節の出現頻度を求めるための装置 | |
EP0544431B1 (en) | Methods and apparatus for selecting semantically significant images in a document image without decoding image content | |
US8005300B2 (en) | Image search system, image search method, and storage medium | |
US6351559B1 (en) | User-enclosed region extraction from scanned document images | |
US7712028B2 (en) | Using annotations for summarizing a document image and itemizing the summary based on similar annotations | |
JPH10198705A (ja) | 文書画像処理装置および文書画像処理方法および情報記録媒体 | |
JPH08180068A (ja) | 電子ファイリング装置 | |
JP4480109B2 (ja) | 画像管理装置および画像管理方法 | |
JPH10198683A (ja) | 文書画像分類方法 | |
WO2023062799A1 (ja) | 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム | |
JPH07152856A (ja) | 光学的文字読取装置 | |
JPH0950488A (ja) | 異サイズ混在文字列の読取り方法 | |
JP3243389B2 (ja) | 文書識別方法 | |
JPH0589279A (ja) | 文字認識装置 | |
JP4998953B2 (ja) | 文字認識装置、文字認識方法、文字認識プログラムおよびコンピュータ読取り可能な記録媒体 | |
JPH10228520A (ja) | 文書画像識別方法 | |
JPH02240788A (ja) | 光学式文字読み取り装置 | |
Coy | A Look at Optoelectronic Document Processing | |
JPH08161430A (ja) | 文字種識別方法 | |
JPH10319939A (ja) | 文字フォント作成装置 | |
JPH08255220A (ja) | 文書解析装置 | |
JP2006072513A (ja) | 文書処理装置およびプログラム |