JPH09282328A - 文書画像処理装置及びその方法 - Google Patents

文書画像処理装置及びその方法

Info

Publication number
JPH09282328A
JPH09282328A JP8094124A JP9412496A JPH09282328A JP H09282328 A JPH09282328 A JP H09282328A JP 8094124 A JP8094124 A JP 8094124A JP 9412496 A JP9412496 A JP 9412496A JP H09282328 A JPH09282328 A JP H09282328A
Authority
JP
Japan
Prior art keywords
document image
keyword
unit
input
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8094124A
Other languages
English (en)
Inventor
Mitsumasa Sugiyama
光正 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP8094124A priority Critical patent/JPH09282328A/ja
Publication of JPH09282328A publication Critical patent/JPH09282328A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 文書画像を登録する際に、操作者はファイリ
ングの体系を把握して階層を指示する必要があり、繁雑
であった。 【解決手段】 予めグループ作成/保持部7に、ファイ
リングの階層情報をキーワードと対応させて作成し、保
持しておく。そして、スキャナから読み込まれた文書画
像に対し、文字認識部5でテキスト情報を得、グループ
判別部6において該テキスト情報内に、上記保持された
階層毎に、対応するキーワードが幾つ含まれているかを
判定する。そして登録部8において、最も多く含んでい
たキーワードの階層に該文書画像を登録する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文書画像処理装置及
びその方法に関し、例えば、文書画像を登録して検索を
行う文書画像処理装置及びその方法に関する。
【0002】
【従来の技術】従来、文字情報からなる原稿画像をスキ
ャナ等によって画像データとして入力し、該画像データ
を所定の規則に基づいて登録(ファイリング)し、必要
に応じてキーワード等による検索を可能とする、所謂文
書画像ファイリング機能を備えた文書画像処理装置が普
及している。
【0003】このような文書画像処理装置においては、
文書画像をファイリングする際に、登録対象の文書画像
に対して、例えばキャビネットやフォルダ等の階層的な
グループ分けを行って登録することができるものがあ
る。このように文書画像を階層的に整理して登録するこ
とにより、例えば検索範囲の指定が行える等、文書画像
の階層的な管理が可能となり、より操作性に優れたファ
イリング機能を実現していた。
【0004】
【発明が解決しようとする課題】しかしながら上記従来
の文書画像処理装置においては、文書画像を登録する階
層は操作者の指示に委ねられていた。従って、操作者は
文書画像を登録する際に、該文書画像をいずれの階層に
登録すべきかを予め認識しておく必要があり、そのた
め、登録作業を行う操作者は該ファイリングの体系を把
握し、該業務に精通した者でなくてはならなかった。ま
た、登録の際に階層を指示する作業が必須であるため、
登録作業自体も繁雑なものであった。
【0005】本発明は上述した問題を解決するためにな
されたものであり、文書画像を入力するだけで自動的に
適切な階層に分類し、登録作業を簡素化する文書画像処
理装置及びその方法を提供することを第1の目的とす
る。
【0006】また、本発明に係る第2の目的は、特にフ
ォーマットの定まった定型文書において、文書画像を入
力するだけで自動的に適切なフォーマットに分類し、登
録作業を簡素化する文書画像処理装置及びその方法を提
供することである。
【0007】また、本発明に係る第3の目的は、特に登
録者や登録日等の条件も鑑みて、文書画像を入力するだ
けで自動的に適切な階層に分類し、登録作業を簡素化す
る文書画像処理装置及びその方法を提供することであ
る。
【0008】また、本発明に係る第4の目的は、新たな
階層を容易に作成可能な文書画像処理装置及びその方法
を提供することである。
【0009】
【課題を解決するための手段】上記目的を達成するため
の一手段として、本発明の文書画像処理装置は以下の構
成を備える。
【0010】即ち、入力された文書画像を分類するため
の階層をキーワードと対応付けて登録する階層登録手段
と、文書画像を入力する文書画像入力手段と、前記文書
画像に対して文字認識処理を行い、テキスト情報を得る
文字認識手段と、前記テキスト情報から前記登録された
階層毎に対応するキーワードを検索するキーワード検索
手段と、前記検索結果に基づいて、前記文書画像を前記
登録された階層のいずれかに分類する分類手段とを有す
ることを特徴とする。
【0011】例えば、前記分類手段は、最も多く検索さ
れたキーワードに対応する階層に、前記文書画像を分類
することを特徴とする。
【0012】また、入力された文書画像を分類するため
の階層をキーワード及び該キーワード位置と対応付けて
登録する階層登録手段と、文書画像を入力する文書画像
入力手段と、前記文書画像に対して文字認識処理を行
い、テキスト情報を得る文字認識手段と、前記テキスト
情報から前記登録された階層毎に対応するキーワードを
検索するキーワード検索手段と、前記検索結果に基づい
て、前記文書画像を前記登録された階層のいずれかに分
類する分類手段とを有することを特徴とする。
【0013】例えば、前記分類手段は、検索されたキー
ワードが対応するキーワード位置にあれば、前記文書画
像を対応する階層に分類することを特徴とする。
【0014】また、入力された文書画像を分類するため
の階層を検索条件を付して登録する階層登録手段と、文
書画像を入力する文書画像入力手段と、前記文書画像が
前記登録された階層毎に対応する検索条件に合致するか
否かを判別する判別手段と、前記判別結果に基づいて、
前記文書画像を前記登録された階層のいずれかに分類す
る分類手段とを有することを特徴とする。
【0015】例えば、前記階層登録手段は、前記文書画
像入力手段から階層登録用フォーマットの文書画像が入
力された場合に、前記文字認識手段によって得られた当
該文書画像のテキスト情報に基づいて、階層情報を登録
することを特徴とする。
【0016】また、上記目的を達成するための一手法と
して、本発明の文書画像処理方法は以下の工程を備え
る。
【0017】即ち、入力された文書画像を分類するため
の階層をキーワードと対応付けて予め登録する文書画像
登録工程と、文書画像を入力する文書画像入力工程と、
前記文書画像に対して文字認識処理を行い、テキスト情
報を得る文字認識工程と、前記テキスト情報から前記登
録された階層毎に対応するキーワードを検索するキーワ
ード検索工程と、前記検索結果に基づいて、前記文書画
像を前記登録された階層のいずれかに分類する分類工程
とを有することを特徴とする。
【0018】また、入力された文書画像を分類するため
の階層をキーワード及び該キーワード位置と対応付けて
予め登録する階層登録工程と、文書画像を入力する文書
画像入力工程と、前記文書画像に対して文字認識処理を
行い、テキスト情報を得る文字認識工程と、前記テキス
ト情報から前記登録された階層毎に対応するキーワード
を検索するキーワード検索工程と、前記検索結果に基づ
いて、前記文書画像を前記登録された階層のいずれかに
分類する分類工程とを有することを特徴とする。
【0019】また、入力された文書画像を分類するため
の階層を検索条件を付して予め登録する階層登録工程
と、文書画像を入力する文書画像入力工程と、前記文書
画像が前記登録された階層毎に対応する検索条件に合致
するか否かを判別する判別工程と、前記判別結果に基づ
いて、前記文書画像を前記登録された階層のいずれかに
分類する分類工程とを有することを特徴とする。
【0020】
【発明の実施の形態】以下、本発明に係る一実施形態に
ついて図面を参照して詳細に説明する。
【0021】<第1実施形態>図1は、本実施形態にお
ける文書画像処理装置のブロック構成を示す図であり、
1はファイリング制御部、2はスキャナ、3は表示部、
4は入力部、11はデータベースである。ファイリング
制御部1において、5は文字認識部、6はグループ判別
部、7はグループ作成/保持部、8は登録部、9は検索
部、10はデータベース管理部である。また、12はフ
ァイリング制御部1と統括的に制御するCPU、13は
CPU12によって動作される制御プログラムを保持す
るROM、14はCPU12の作業領域として動作する
RAMである。尚、後述するフローチャートに示す処理
を実現するプログラムは、ROM13に格納されてお
り、必要に応じてCPU12によって実行される。
【0022】以下、図1に示す構成における動作につい
て簡単に説明する。
【0023】まず入力部4はキーボード等によって構成
され、操作者からの入力を受ける。本実施形態において
新たなグループを登録するには、入力部4から「グルー
プ作成の指示」と「グループ名」と「キーワード」を入
力する。するとグループ作成/保持部7において、使用
されていないグループIDを新しいグループに割り当
て、入力された「グループ名」と「キーワード」とを対
応付けて登録・保持する。
【0024】そして文書画像を入力する際には、まず画
像入力を行うスキャナ2により文書画像を入力する。す
ると該文書画像は文字認識部5に送られて文字認識処理
が施され、該文字認識結果であるテキスト情報、及び各
文字の位置情報がグループ判別部6に送られる。グルー
プ判別部6においては、入力された文書画像のテキスト
情報を解析し、文字グループ作成/保持部7に予め登録
・保持されている各キーワードがそれぞれいくつ含まれ
ているかを調べる。そして、最も多く含んでいたキーワ
ードの属するグループを判別し、登録部8において、入
力された文書画像が該グループとして分類されることを
データベース管理部10に登録し、かつ、文字認識結果
をデータベース11に登録する。
【0025】例えば、グループ作成/保持部7に、ある
グループのキーワードとして「電子ファイル」が登録さ
れているとする。この時、操作者が「電子ファイル」と
いう単語が数多く含まれている、電子ファイルに関する
文書をスキャナ2より読み込む。すると、該文書画像を
文字認識した結果得られるテキスト情報には、「電子フ
ァイル」という単語が多数含まれているため、当該入力
文書画像は、自動的に「電子ファイル」というキーワー
ドの属するグループとして分類される。
【0026】次に、グループ作成/保持部7におけるグ
ループ作成/保持処理を、図2のフローチャートを参照
して説明する。グループ作成/保持部7では、入力部4
から入力されたグループ名に対して、使用されていない
グループIDを割り当て、該グループ名と同じく入力さ
れたキーワードとを対応付けて登録する(ステップS2
1)。
【0027】次に、グループ判別部6におけるグループ
判別処理を、図3のフローチャートを参照して説明す
る。
【0028】まずステップS31において、入力された
文書画像に対して文字認識処理を行なった結果得られる
テキスト情報に対して、グループ作成/保持部7に保持
されているキーワードを、全てのグループにおいて調べ
たか否かを判定する。まだ調べていないグループがある
場合には、ステップS32で該未処理のグループに登録
されているキーワードが、文書画像のテキスト情報にい
くつ含まれているかを調べ、ステップS31に戻る。そ
して、全てのグループについて調べ終わった場合はステ
ップS33に進み、最も多く含まれていたキーワードの
グループに、入力文書画像を分類する。
【0029】以上説明した様にして分類・登録された文
書画像は、入力部4において指定された検索指示に基づ
いて、検索部9よりデータベース管理部10及びデータ
ベース11より検索される。この検索指示としては、例
えば登録済みのグループによる検索や、またキーワード
による検索も可能である。
【0030】ここで図4に、本実施形態においてグルー
プに分類された文書画像の表示部3における表示例を示
す。尚、本実施形態において文書画像を分類するための
グループを、以降「フォルダ」と称する。即ち、スキャ
ナ2より入力された文書画像は適当なフォルダに分類さ
れる。図4に示す例においては、「議事録」及び「保養
施設」という2つのフォルダがあり、「保養施設」フォ
ルダには、「年間保養施設」と「季節保養施設」の2つ
の文書画像が登録されていることを示す。
【0031】また図5に、本実施形態においてグループ
(フォルダ)登録を行うための表示部3における表示例
を示す。入力部4よりフォルダ名とキーワードを入力
し、作成ボタンを指示することにより、新たなグループ
(フォルダ)を作成することができる。図5において
は、フォルダ名として「特許」、キーワードとして「特
許公報」を登録する例を示す。
【0032】以上説明した様に本実施形態によれば、操
作者が予めグループ名及び該グループに属するキーワー
ドを登録しておくことにより、入力された文書画像に含
まれるテキスト情報を解析し、最適なキーワードに対応
したグループとして自動的に分類される。従って、操作
者は繁雑な操作をすることなく、適切な分類処理を伴っ
た文書ファイリングが可能となる。
【0033】<第2実施形態>以下、本発明に係る第2
実施形態について説明する。
【0034】上述した第1実施形態においては、キーワ
ードを対応させてグループを登録する例について説明を
行なった。第2実施形態においては、更にキーワードの
位置情報も登録することにより、特に定型文書のファイ
リング処理を行う場合に、より確実な分類が可能となる
例について説明する。
【0035】尚、第2実施形態における装置構成は上述
した第1実施形態と同様であるため、説明を省略する。
【0036】図6に、グループ作成/保持部7における
グループ作成/保持処理のフローチャートを示し、説明
する。
【0037】第2実施形態におけるグループ作成/保持
部7では、入力部4から入力されたグループ名に対し
て、使用されていないグループIDを割り当て、該グル
ープ名と同じく入力されたキーワード、及び該キーワー
ドの位置情報とを対応付けて登録する(ステップS6
1)。
【0038】ここで図8に、第2実施形態においてグル
ープ(フォルダ)登録を行うための表示部3における表
示例を示す。入力部4より該表示画面に対してフォルダ
名とキーワードを入力し、更にキーワードの位置指定を
行う。そして作成ボタンを指示することにより、新たな
グループ(フォルダ)を作成することができる。図8に
おいては、フォルダ名として「特許」、キーワードとし
て「特許出願公告番号」、該キーワード位置を文書の右
上として登録する例を示す。
【0039】次に、第2実施形態のグループ判別部6に
おけるグループ判別処理を、図7のフローチャートを参
照して説明する。
【0040】まずステップS71において、入力された
文書画像に対して文字認識処理を行なった結果得られる
テキスト情報に対して、グループ作成/保持部7に保持
されているキーワード及びその位置情報を、全てのグル
ープにおいて調べたか否かを判定する。まだ調べていな
いグループがある場合には、ステップS72で該未処理
のグループに登録されているキーワードが、文書画像の
テキスト情報内の、登録された位置にあるかを判定す
る。登録キーワードが登録位置にあれば、ステップS7
3に進んで入力文書を該グループに分類し、処理を終了
する。一方、ステップS72で登録キーワードが登録位
置になければ、ステップS71に戻る。そして、全ての
グループについて調べ終わったにも関らず該当グループ
がない場合にはステップS74に進み、該入力文書を予
め決められているグループに分類する。即ち第2実施形
態においては、スキャナ2より文書画像を入力するに先
だって、定型グループに分類されない文書画像を分類す
るグループを定めておく必要がある。
【0041】以上説明した様に第2実施形態によれば、
操作者が予めグループ名及び該グループに属するキーワ
ード及び該キーワード位置を登録しておくことにより、
入力された文書画像に含まれるテキスト情報を解析し、
最適な位置のキーワードに対応するグループとして自動
的に分類される。従って、操作者は繁雑な操作をするこ
となく、適切な分類処理を伴った文書ファイリングが可
能となる。
【0042】第2実施形態によれば特に、キーワードの
位置が定まっている、所謂定型フォーマットの文書を正
確に分類することができる。例えば、図8に示す様に
「特許」のグループとして「特許出願公告番号」という
キーワードが文書画像の右上にあると登録しておけば、
特許公報を文書画像としてスキャナ2より入力した場合
は「特許」グループに分類されるが、特許検討の議事録
等は「特許」グループには分類されない。
【0043】<第3実施形態>以下、本発明に係る第3
実施形態について説明する。
【0044】上述した第1及び第2実施形態において
は、キーワード及び該キーワード位置に対応させてグル
ープを登録する例について説明を行なった。第3実施形
態においては、更に文書名、日付、登録者名等の登録条
件もキーワードに対応して登録する例について説明す
る。
【0045】尚、第3実施形態における装置構成は上述
した第1実施形態と同様であるため、説明を省略する。
【0046】図9に、グループ作成/保持部7における
グループ作成/保持処理のフローチャートを示し、説明
する。
【0047】第3実施形態におけるグループ作成/保持
部7では、入力部4から入力されたグループ名に対し
て、使用されていないグループIDを割り当て、該グル
ープ名と同じく入力されたキーワード、及び該キーワー
ドに対応する登録条件(文書名、日付、登録者名等)を
対応付けて登録する(ステップS91)。
【0048】次に、第3実施形態のグループ判別部6に
おけるグループ判別処理を、図10のフローチャートを
参照して説明する。
【0049】まずステップS101において、入力され
た文書画像に対して文字認識処理を行なった結果得られ
るテキスト情報に対して、グループ作成/保持部7に保
持されているキーワードを、全てのグループにおいて調
べたか否かを判定する。まだ調べていないグループがあ
る場合には、ステップS102で該未処理のグループに
登録されているキーワードが文書画像のテキスト情報に
含まれており、かつ該文書画像の登録要件は、すでに登
録されている登録条件に合致するか否かを判定する。全
てを満たすのであればステップS103に進んで入力文
書を該グループに分類し、処理を終了する。一方、ステ
ップS102で登録キーワードがない、又は登録条件が
合致しない場合にはステップS101に戻る。そして、
全てのグループについて調べ終わったにも関らず該当グ
ループがない場合にはステップS104に進み、該入力
文書を予め決められているグループに分類する。即ち第
3実施形態においては、スキャナ2より文書画像を入力
するに先だって、定型グループに分類されない文書画像
を分類するグループを定めておく必要がある。
【0050】ここで図11に、第3実施形態においてグ
ループに分類された文書画像の表示部3における表示例
を示す。図11においては各月毎の議事録フォルダが用
意されており、入力される文書画像は、登録日に応じて
該当する月のフォルダに自動的に登録される。
【0051】また図12に、第3実施形態においてグル
ープ(フォルダ)登録を行うための表示部3における表
示例を示す。入力部4より該表示画面に対してフォルダ
名とキーワードを入力し、更に登録期間の入力を行う。
そして作成ボタンを指示することにより、新たなグルー
プ(フォルダ)を作成することができる。図12におい
ては、フォルダ名として「4月議事録」、キーワードと
して「議事録」、登録要件となる登録開始(日付)を
「1996年4月1日」、登録終了(日付)を「199
6年4月30日」として登録する例を示す。即ち、キー
ワード「議事録」を含む文書画像のうち、登録開始と登
録終了との間の期間(1996年4月中)に登録された
ものが「4月議事録」フォルダに分類される。
【0052】以上説明した様に第3実施形態によれば、
操作者が予めグループ名及び該グループに属するキーワ
ード及び登録条件を登録しておくことにより、入力され
た文書画像に含まれるテキスト情報を解析し、キーワー
ド及び登録条件に合致するグループとして自動的に分類
される。従って、操作者は繁雑な操作をすることなく、
適切な分類処理を伴った文書ファイリングが可能とな
る。
【0053】更に、登録条件として文書名、登録日付や
登録者等、操作者の所望する項目を設定することによ
り、文書ファイリングにおける自動分類を最適化するこ
とができる。
【0054】<第4実施形態>以下、本発明に係る第4
実施形態について説明する。
【0055】上述した第1〜第3実施形態においては、
操作者が入力部4よりグループ名やキーワード等を入力
することにより、新たなグループを作成する例について
説明した。第4実施形態においては、スキャナ部2より
定型フォーマット用紙を入力することにより、その文字
認識結果及び位置情報に基づいてグループを登録する例
について説明する。
【0056】図13に、第4実施形態における文書画像
処理装置のブロック構成を示す。図13において上述し
た第1実施形態の図1と同様の構成については同一番号
を付し、説明を省略する。図13においては、文字認識
部5とグループ作成/保持部7とが接続されていること
を特徴とする。
【0057】第4実施形態における文字認識部5は、入
力部4よりグループ作成の指示がある場合には、スキャ
ナ2から入力された定型フォーマット文書画像の文字認
識結果をグループ作成/保持部7に送る。
【0058】尚、ここで入力する定型フォーマットとし
ては、登録すべき検索情報(フォルダ名やキーワード、
登録日等)を定位置に記載する必要がある。例えば、図
12に示した様式を使用しても良い。
【0059】そしてグループ作成/保持部7において
は、文字認識部5から受け取ったテキスト情報および位
置情報に基づいて、新たなグループ名及びキーワード等
を、グループIDに対応付けて登録する。
【0060】図14に、グループ作成/保持部7におけ
るグループ作成/保持処理のフローチャートを示し、説
明する。
【0061】第4実施形態におけるグループ作成/保持
部7では、グループ作成指示があると、文字認識部5か
ら入力されたテキスト情報に基づくグループ名に対し
て、使用されていないグループIDを割り当て、該グル
ープ名と同じく入力されたキーワード、及び該キーワー
ド位置、及び登録条件等を対応付けて登録する(ステッ
プS141)。
【0062】以上説明した様に第4実施形態によれば、
定型フォーマット用紙をスキャナより入力し、その文字
認識結果及び位置情報に基づいてグループを登録するこ
とができるため、グループ登録をより簡単に行うことが
できる。
【0063】特に、グループにキーワードの位置情報を
対応させて登録する場合に、第4実施形態は有効であ
る。
【0064】尚、上述した第1〜第4実施形態において
は、文書画像をスキャナ2から入力するとして説明を行
ったが、本発明はこの例に限定されず、例えば該文書画
像処理装置をファクシミリ装置に適用しても、またFA
Xモデムを介して文書画像を入力してもよい。すると、
他のファクシミリ装置や外部コンピュータから送信され
た文書画像を自動的に分類することができる。
【0065】また、上述した第1〜第4実施形態におい
ては、分類するグループが1階層である場合について説
明したが、本発明はもちろん複数階層であってもよい。
その場合には、グループ判別処理を多段階に行えばよ
い。このようにグループを複数階層とすることにより、
更にフレキシブルな分類が実現する。
【0066】<他の実施形態>なお、本発明は、複数の
機器(例えばホストコンピュータ,インタフェイス機
器,リーダ,プリンタなど)から構成されるシステムに
適用しても、一つの機器からなる装置(例えば、複写
機,ファクシミリ装置など)に適用してもよい。
【0067】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0068】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0069】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0070】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0071】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0072】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードを格納することになるが、簡単に説
明すると、例えば図15のメモリマップ例に示す各モジ
ュールを記憶媒体に格納することになる。すなわち、少
なくとも「グループ登録モジュール」「キーワード検索
モジュール」「検索終了判定モジュール」及び「グルー
プ分類モジュール」の各モジュールのプログラムコード
を記憶媒体に格納すればよい。
【0073】
【発明の効果】以上説明したように本発明によれば、予
めグループにキーワードやその位置情報、登録条件等を
対応付けて登録しておくことにより、文書画像を入力す
るだけで自動的に適切な階層(グループ)に分類し、登
録作業を簡素化することができる。
【0074】
【図面の簡単な説明】
【図1】本発明に係る一実施形態である文書画像処理装
置のブロック構成を示す図である。
【図2】本実施形態におけるグループ作成処理を示すフ
ローチャートである。
【図3】本実施形態におけるグループ判別処理を示すフ
ローチャートである。
【図4】本実施形態において文書画像を分類表示する際
の表示例を示す図である。
【図5】本実施形態においてグループを作成するための
表示例を示す図である。
【図6】本発明に係る第2実施形態におけるグループ作
成処理を示すフローチャートである。
【図7】第2実施形態におけるグループ判別処理を示す
フローチャートである。
【図8】第2実施形態においてグループを作成するため
の表示例を示す図である。
【図9】本発明に係る第3実施形態におけるグループ作
成処理を示すフローチャートである。
【図10】第3実施形態におけるグループ判別処理を示
すフローチャートである。
【図11】第3実施形態において文書画像を分類評時す
る際の表示例を示す図である。
【図12】第3実施形態においてグループを作成するた
めの表示例を示す図である。
【図13】本発明に係る第4実施形態における文書画像
処理装置のブロック構成を示す図である。
【図14】第4実施形態におけるグループ作成処理を示
すフローチャートである。
【図15】本発明を実現するプログラムが保持されるメ
モリマップ例を示す図である。
【符号の説明】
1 ファイリング制御部 2 スキャナ 3 表示部 4 入力部 5 文字認識部 6 グループ判別部 7 グループ作成部 8 登録部 9 検索部 10 データベース管理部 11 データベース 12 CPU 13 ROM 14 RAM

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 入力された文書画像を分類するための階
    層をキーワードと対応付けて登録する階層登録手段と、 文書画像を入力する文書画像入力手段と、 前記文書画像に対して文字認識処理を行い、テキスト情
    報を得る文字認識手段と、 前記テキスト情報から前記登録された階層毎に対応する
    キーワードを検索するキーワード検索手段と、 前記検索結果に基づいて、前記文書画像を前記登録され
    た階層のいずれかに分類する分類手段と、を有すること
    を特徴とする文書画像処理装置。
  2. 【請求項2】 前記分類手段は、最も多く検索されたキ
    ーワードに対応する階層に、前記文書画像を分類するこ
    とを特徴とする請求項1記載の文書画像処理装置。
  3. 【請求項3】 入力された文書画像を分類するための階
    層をキーワード及び該キーワード位置と対応付けて登録
    する階層登録手段と、 文書画像を入力する文書画像入力手段と、 前記文書画像に対して文字認識処理を行い、テキスト情
    報を得る文字認識手段と、 前記テキスト情報から前記登録された階層毎に対応する
    キーワードを検索するキーワード検索手段と、 前記検索結果に基づいて、前記文書画像を前記登録され
    た階層のいずれかに分類する分類手段と、を有すること
    を特徴とする文書画像処理装置。
  4. 【請求項4】 前記分類手段は、検索されたキーワード
    が対応するキーワード位置にあれば、前記文書画像を対
    応する階層に分類することを特徴とする請求項3記載の
    文書画像処理装置。
  5. 【請求項5】 前記分類手段は、前記文書画像がキーワ
    ードに対応する階層に分類できない場合、所定の階層に
    分類することを特徴とする請求項4記載の画像処理装
    置。
  6. 【請求項6】 入力された文書画像を分類するための階
    層を検索条件を付して登録する階層登録手段と、 文書画像を入力する文書画像入力手段と、 前記文書画像が前記登録された階層毎に対応する検索条
    件に合致するか否かを判別する判別手段と、 前記判別結果に基づいて、前記文書画像を前記登録され
    た階層のいずれかに分類する分類手段と、を有すること
    を特徴とする文書画像処理装置。
  7. 【請求項7】 前記検索条件はキーワード情報を含み、 前記判別手段は、 前記文書画像に対して文字認識処理を行い、テキスト情
    報を得る文字認識手段と、 前記テキスト情報から前記登録された階層毎に対応する
    キーワードを検索するキーワード検索手段と、を有する
    ことを特徴とする請求項6記載の文書画像処理装置。
  8. 【請求項8】 前記検索条件は登録日情報を含むことを
    特徴とする請求項6又は7記載の文書画像処理装置
  9. 【請求項9】 前記検索条件は登録者情報を含むことを
    特徴とする請求項6乃至8のいずれかに記載の文書画像
    処理装置
  10. 【請求項10】 前記検索条件は文書名情報を含むこと
    を特徴とする請求項6乃至9のいずれかに記載の文書画
    像処理装置
  11. 【請求項11】 前記階層登録手段は、前記文書画像入
    力手段から階層登録用フォーマットの文書画像が入力さ
    れた場合に、前記文字認識手段によって得られた当該文
    書画像のテキスト情報に基づいて、階層情報を登録する
    ことを特徴とする請求項1乃至10のいずれかに記載の
    文書画像処理装置。
  12. 【請求項12】 更に、前記階層登録用フォーマットの
    文書画像を入力する旨を指示する指示手段を有し、 前記階層登録手段は、前記指示があった場合に、前記文
    書画像入力手段から入力された文書画像が階層登録用フ
    ォーマットであるとして階層登録処理を行うことを特徴
    とする請求項11記載の文書画像処理装置。
  13. 【請求項13】 更に、前記登録された階層情報を表示
    する表示手段を有することを特徴とする請求項1乃至1
    2のいずれかに記載の文書画像処理装置。
  14. 【請求項14】 前記階層は複数階層であることを特徴
    とする請求項1乃至13のいずれかに記載の文書画像処
    理装置
  15. 【請求項15】 更に、前記分類された文書画像を検索
    する文書画像検索手段を有することを特徴とする請求項
    1乃至14のいずれかに記載の文書画像処理装置。
  16. 【請求項16】 入力された文書画像を分類するための
    階層をキーワードと対応付けて予め登録する文書画像登
    録工程と、 文書画像を入力する文書画像入力工程と、 前記文書画像に対して文字認識処理を行い、テキスト情
    報を得る文字認識工程と、 前記テキスト情報から前記登録された階層毎に対応する
    キーワードを検索するキーワード検索工程と、 前記検索結果に基づいて、前記文書画像を前記登録され
    た階層のいずれかに分類する分類工程と、を有すること
    を特徴とする文書画像処理方法。
  17. 【請求項17】 入力された文書画像を分類するための
    階層をキーワード及び該キーワード位置と対応付けて予
    め登録する階層登録工程と、 文書画像を入力する文書画像入力工程と、 前記文書画像に対して文字認識処理を行い、テキスト情
    報を得る文字認識工程と、 前記テキスト情報から前記登録された階層毎に対応する
    キーワードを検索するキーワード検索工程と、 前記検索結果に基づいて、前記文書画像を前記登録され
    た階層のいずれかに分類する分類工程と、を有すること
    を特徴とする文書画像処理方法。
  18. 【請求項18】 入力された文書画像を分類するための
    階層を検索条件を付して予め登録する階層登録工程と、 文書画像を入力する文書画像入力工程と、 前記文書画像が前記登録された階層毎に対応する検索条
    件に合致するか否かを判別する判別工程と、 前記判別結果に基づいて、前記文書画像を前記登録され
    た階層のいずれかに分類する分類工程と、を有すること
    を特徴とする文書画像処理方法。
  19. 【請求項19】 文書画像処理のプログラムコードが格
    納されたコンピュータ可読メモリであって、 入力された文書画像を分類するための階層を検索条件を
    付して予め登録する階層登録工程のコードと、 文書画像を入力する文書画像入力工程のコードと、 前記文書画像が前記登録された階層毎に対応する検索条
    件に合致するか否かを判別する判別工程のコードと、 前記判別結果に基づいて、前記文書画像を前記登録され
    た階層のいずれかに分類する分類工程のコードと、を有
    することを特徴とするコンピュータ可読メモリ。
JP8094124A 1996-04-16 1996-04-16 文書画像処理装置及びその方法 Withdrawn JPH09282328A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8094124A JPH09282328A (ja) 1996-04-16 1996-04-16 文書画像処理装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8094124A JPH09282328A (ja) 1996-04-16 1996-04-16 文書画像処理装置及びその方法

Publications (1)

Publication Number Publication Date
JPH09282328A true JPH09282328A (ja) 1997-10-31

Family

ID=14101680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8094124A Withdrawn JPH09282328A (ja) 1996-04-16 1996-04-16 文書画像処理装置及びその方法

Country Status (1)

Country Link
JP (1) JPH09282328A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6263333B1 (en) 1998-10-22 2001-07-17 International Business Machines Corporation Method for searching non-tokenized text and tokenized text for matches against a keyword data structure
JP2007094518A (ja) * 2005-09-27 2007-04-12 Nec Personal Products Co Ltd 携帯情報端末装置、情報処理装置、及び、画像整理方法
JP2009181479A (ja) * 2008-01-31 2009-08-13 Japan Digital Laboratory Co Ltd データ管理システムおよび方法並びにプログラム
US7860316B2 (en) 2005-11-18 2010-12-28 Samsung Electronics Co., Ltd. Image forming apparatus that automatically creates an index and a method thereof
WO2012102226A1 (ja) * 2011-01-26 2012-08-02 オリンパス株式会社 キーワード付与装置、プログラム、情報記憶媒体及びキーワード付与処理方法
JP2013031155A (ja) * 2011-06-23 2013-02-07 Ricoh Co Ltd 画像データ配信装置、画像データ配信システムおよびプログラム
CN113815332A (zh) * 2021-10-28 2021-12-21 李贝贝 一种基于大数据的信息处理方法
CN115297215A (zh) * 2021-08-05 2022-11-04 京瓷办公信息系统株式会社 图像处理装置以及图像形成装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6263333B1 (en) 1998-10-22 2001-07-17 International Business Machines Corporation Method for searching non-tokenized text and tokenized text for matches against a keyword data structure
JP2007094518A (ja) * 2005-09-27 2007-04-12 Nec Personal Products Co Ltd 携帯情報端末装置、情報処理装置、及び、画像整理方法
US7860316B2 (en) 2005-11-18 2010-12-28 Samsung Electronics Co., Ltd. Image forming apparatus that automatically creates an index and a method thereof
US8369623B2 (en) 2005-11-18 2013-02-05 Samsung Electronics Co., Ltd. Image forming apparatus that automatically creates an index and a method thereof
JP2009181479A (ja) * 2008-01-31 2009-08-13 Japan Digital Laboratory Co Ltd データ管理システムおよび方法並びにプログラム
WO2012102226A1 (ja) * 2011-01-26 2012-08-02 オリンパス株式会社 キーワード付与装置、プログラム、情報記憶媒体及びキーワード付与処理方法
JP2013031155A (ja) * 2011-06-23 2013-02-07 Ricoh Co Ltd 画像データ配信装置、画像データ配信システムおよびプログラム
CN115297215A (zh) * 2021-08-05 2022-11-04 京瓷办公信息系统株式会社 图像处理装置以及图像形成装置
CN113815332A (zh) * 2021-10-28 2021-12-21 李贝贝 一种基于大数据的信息处理方法

Similar Documents

Publication Publication Date Title
US6549913B1 (en) Method for compiling an image database, an image database system, and an image data storage medium
JP4260790B2 (ja) ファイリング・検索装置およびファイリング・検索方法
JP4366108B2 (ja) 文書検索装置、文書検索方法及びコンピュータプログラム
JP2001126026A (ja) 情報入力装置
JP2001357046A (ja) 電子画像化装置、キーワード付与システムおよびキーワード付与方法
US20060045340A1 (en) Character recognition apparatus and character recognition method
CN101539947B (zh) 用于存储具有部分图像的文档的信息处理装置
JP2005018678A (ja) 帳票データ入力処理装置、帳票データ入力処理方法及びプログラム
JP2973913B2 (ja) 入力シートシステム
JPH09282328A (ja) 文書画像処理装置及びその方法
US20020051015A1 (en) File management device and file management method
JP2020181369A (ja) 書類読取システム
JP3185170B2 (ja) データ入力システム
JPH10255027A (ja) 画像処理装置
JP2002024761A (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JP2018195899A (ja) 情報処理装置及び情報処理プログラム
JP2000099535A (ja) 画像検索装置及びその方法、コンピュータ可読メモリ
JP2001243248A (ja) 電子ファイリングシステム
US5793495A (en) Method for avoiding creation of duplicate keyword objects representing user entered data on a machine readable form
JPH03202958A (ja) 画像情報記憶検索装置
US8115952B2 (en) Document managing system, image forming device, discarding device, discard certificate issuing device, document attribute managing device, and computer readable medium
JP4823049B2 (ja) 文書画像検索装置及びプログラム
JP2932667B2 (ja) 情報の検索方法および情報蓄積装置
JP2000067179A (ja) Icカード、icカード作成装置、データ管理装置、データ検索装置、icカード作成方法及びデータ管理方法
JP2001101213A (ja) 情報処理装置、ドキュメント管理装置、情報処理システム、情報管理方法、及び記憶媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030701