JP2005260655A - 画像形成装置 - Google Patents

画像形成装置 Download PDF

Info

Publication number
JP2005260655A
JP2005260655A JP2004070517A JP2004070517A JP2005260655A JP 2005260655 A JP2005260655 A JP 2005260655A JP 2004070517 A JP2004070517 A JP 2004070517A JP 2004070517 A JP2004070517 A JP 2004070517A JP 2005260655 A JP2005260655 A JP 2005260655A
Authority
JP
Japan
Prior art keywords
image
data
character
document
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004070517A
Other languages
English (en)
Inventor
Ryotaro Imine
良太郎 井峯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004070517A priority Critical patent/JP2005260655A/ja
Publication of JP2005260655A publication Critical patent/JP2005260655A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】視覚的弱者に対して原稿読み取り装置より読み込んだ原稿の種別を音声で知らせることができる画像形成装置を提供すること。
【解決手段】音声を発生させる音声発生装置と、原稿を光学的に読み取り電子データに変換する画像読み取り手段と、前記画像読み取り手段により読み取られた画像データを一時記憶するデータ記憶手段と、前記画像記録手段に記憶されている画像データに基づく可視像を記録媒体上に形成する画像形成手段を有する画像形成装置において、前記画像読み取り手段により読み取られた画像データより画像の領域と画像領域中の文字列を判別する文字列判別手段と、前記文字列判定手段の判定結果に基づいて前記音声発生装置を制御する手段と、を有することを特徴とする。
【選択図】図1

Description

本発明は、原稿を光学的に読み取り電気信号に変換して記録媒体へ一時記憶し、記憶されたデータに基づき被記録媒体上へ可視の画像を形成する画像形成装置に関するものである。
特に、本発明画像形成装置の有する原稿読み取り装置により読み取られた原稿についてその読み取られた原稿の種別を判定し、音声発生装置を制御することによりメッセージを発生させユーザに原稿種別を認識させるものである。
従来、原稿を光学的に読み取り、読み取った画像データよりテキストデータを抽出し、編集可能なテキストデータに変換する画像入出力装置が知られている。
又、原稿読み取り手段により読み込んだ画像を一時記憶するための記憶手段を有する記憶手段において記憶された画像データを被記録材上に画像形成を行うことが可能な画像形成装置が知られている。
以上のような画像形成装置において視力が低いユーザ等視覚的な弱者が認識することが難しいとされる原稿中の文字サイズや原稿の種別について、原稿の表裏や種別を確認しないまま原稿を原稿読み取り装置で読み込ませることを想定した場合、原稿台又は自動原稿送り装置にセットする方向を誤ってセットする場合に音声で原稿読み取り装置への原稿のセット状態並びにセットしている原稿の種別を通知してリカバリを促す方法が必要である。
本発明は上記事情に鑑みてなされたもので、その目的とする処は、視覚的弱者に対して原稿読み取り装置より読み込んだ原稿の種別を音声で知らせることができる画像形成装置を提供することにある。
上記目的を達成するため、本発明は、音声を発生させる音声発生装置と、原稿を光学的に読み取り電子データに変換する画像読み取り手段と、前記画像読み取り手段により読み取られた画像データを一時記憶するデータ記憶手段と、前記画像記録手段に記憶されている画像データに基づく可視像を記録媒体上に形成する画像形成手段を有する画像形成装置において、前記画像読み取り手段により読み取られた画像データより画像の領域と画像領域中の文字列を判別する文字列判別手段と、前記文字列判定手段の判定結果に基づいて前記音声発生装置を制御する手段と、を有することを特徴とする。
とから構成した。
本発明によれば、原稿読み取り装置に読み込まれたデータより文字及びそのサイズ、位置又はイメージを抽出して編集可能なフォーマットとし、そのフォーマットより原稿の種別を判定し、判定結果に基づく音声を発生させることにより、視覚的弱者に対して原稿種別を音声で知らせることができる。
以下に本発明の実施の形態を添付図面に基づいて説明する。
図1は本発明に係る画像形成装置の概略図である。
スキャナ101は、原稿台102又は自動原稿送り装置103に置かれた原稿を光学的に読み取り電子データに変換する。コントローラユニット104は、スキャナ101と印刷機105間のデータの処理や機器制御を司る。具体的には、ハードディスク106等の記録装置にスキャナによって読み込んだ画像データを一時的に記録を行ったり、図示しないネットワーク上の情報処理装置へデータを送信する等、多目的の制御を司る機器制御ブロックや、スキャナ101によって読み込んだ画像データより文字を抽出し編集可能なフォーマットへ変換する文字抽出変換ブロック108、前記文字抽出変換ブロックで変換されたフォーマットデータより原稿種別を判定し音声データを発生する音声発生ブロック107、画像読み取り時や印刷機105において被記録材へ印刷する時に各種画像処理を行う画像処理ブロック109を有する。
又、コントローラユニット104にはその他に図示しないEtherNetや電話回線等ネットワーク通信するためのI/Fを有するネットワークブロック、画像形成装置の機能を拡張するためのPDLプリントI/F、CPUアクセラレータI/F等もユニットとして構成することができる。又、画像読み取りから画像形成に至る制御は図2に示す操作部を通してユーザが設定操作を行う。特に、本発明に係る実施形態として画像処理ユニット並びに画像データを一時的に記録を行う記憶装置を用いて提案する装置の詳細は後に詳しく述べる。
図2に操作部の構成を示す。図2は図1に示す画像読み取り機101における操作パネル106の外観を示す図である。
LCD表示部201は、LCD上にタッチパネルシートが貼られており、システムの操作画面を表示するとともに、表示してあるキーが押されるとその位置情報をコントローラCPUに伝える。スタートキー202は、原稿画像の読取り動作を開始する時等に用いる。スタートキー中央部には、緑と赤の2色LEDがあり、その色によってスタートキーが使える状態にあるかどうかを示す。ストップキー203は、稼働中の動作を止める働きをする。IDキー204は、使用者のユーザIDを入力するときに用いる。リセットキー205は、操作部からの設定を初期化するときに用いる。
図3に画像読み取り装置の構成を示す。
図3において、301は原稿台ガラスであり、読み取られるべき原稿302が所定の位置に置かれる。原稿302は、例えばハロゲンランプから構成される照明ランプ303により照射され、その反射光はミラー304,305,306を経てレンズ307によりCCD308上に結像される。ミラー304、照明ランプ303を含む第1ミラーユニット310のミラー304は、速度vで移動し、ミラー305,306を含む第2ミラーユニット311は、速度1/2vで移動することにより、原稿302の前面を走査する。第1ミラーユニット310及び第2ミラーユニット311は、モータ309により駆動する。CCD308によって撮像されると、例えばR,G,Bそれぞれ8ビットのデジタル画像信号に変換され、図4に示す画像処理や装置のシーケンス制御を行うコントローラユニットへ入力される。
次に、コントロールユニットの構成を示す。
コントロールユニットは、CPU401、画像処理回路402、RAM403、ROM404、I/O制御回路405、画像データや機器制御プログラム等を記憶する記憶装置406、ネットワークI/F407、操作部408、操作部408上に表示されるデータを記憶するVRAM409、制御プログラム等が記憶されているROM410、拡張インターフェース411から構成されている。
CPU401は、画像のJBIG,JPEG等の圧縮、伸長、回転等をRAM403上のデータに対して施す処理機能とネットワークインターフェイス407を介してイーサネット等のネットワークとの通信を行うネットワークコントローラ、又、PCの標準拡張バスであるPCIバスインターフェースを有し、拡張I/F411に拡張デバイスを接続することにより機能の拡張を行うことができる。本発明に係る画像形成装置には前記拡張デバイスとして音声発生装置を接続している。音声発生装置はPCIバスI/Fを有しており、スピーカとアンプから構成される一般的なものである。音声発生装置は、CPU401からのコマンドで任意の音声を合成する。
コントロールユニット103へは図3に示した画像読み取り装置で読み取られたデジタル画像データが入力される。入力されたデジタルデータは、画像処理回路402で画像処理を施され、CPU401を経由してRAM403又はI/O制御回路405を経由して接続されているHDD等の記憶装置406に圧縮して一時記憶する。一時的に圧縮記憶したビットマップデータは、CPU406が伸長しRAMに展開する。RAM上に展開された画像データをそのまま画像処理回路を介して印刷機へデータを出力、或は展開されたデータについてCPU406が文字抽出変換処理を施し、編集可能なフォーマットとして文書を構成する。構成された編集可能フォーマットについて更にメモリに格納されている文字サイズのレファレンス値を参照して文字拡大処理を施す。文字拡大された文書データについて操作部上の画面に等倍表示するためのプレビュー画像を作成し、VRAM上に転送する。転送されたデータに基づき操作部上に表示する。
図5により印刷機105における画像データの信号処理を説明をする。
画像処理ブロックを出たイエロー(Y)、マゼンダ(M)、シアン(C)、ブラック(K)の4色に色分解された画像データは、それぞれの図示しないPWM部を通ってそれぞれ画像形成される。501は三角波発生部、502は入力されるデジタル画像信号をアナログ信号に変換するD/Aコンバータ(D/A変換部)である。三角波発生501からの信号(図5(2)のa)及びD/Aコンバータ502からの信号(図5(2)のb)は、コンパレータ503で代償比較されて、図5(2)のcのような信号となってレーザ駆動部504に送られ、CMYKそれぞれがCMYKそれぞれのレーザ505でレーザビームに変換される。
そして、ポリゴンスキャナ613で、それぞれのレーザビームを走査して、それぞれの感光ドラム617,621,625,629に照射される。
図6にカラー印刷機の概要図を示す。
613はポリゴンミラーであり、4つの半導体レーザ605より発光された4本のレーザ光を受ける。その内の1本はミラー614,615,616を経て感光ドラム617を走査し、次の1本はミラー618,619,620を経て感光ドラム621を走査し、62,623,624を経て感光ドラム625を走査し、次の1本はミラー626,627,628を経て感光ドラム629を走査する。
一方、630はイエロー(Y)のトナーを供給する現像器であり、レーザ光に従い、感光ドラム617上にイエローのトナー像を形成し、631はマゼンタ(M)のトナーを供給する現像器であり、レーザ光に従い、感光ドラム621上にマゼンタのトナー像を形成し、632はシアン(C)のトナーを供給する現像器であり、レーザ光に従い感光ドラム625上にシアンのトナー像を形成し、633はブラック(K)のトナーを供給する現像器であり、レーザ光に従い、感光ドラム629上にマゼンタのトナー像を形成する。
以上4色(Y,M,C,K)のトナー像がシートに転写され、フルカラーの出力画像を得ることができる。
シートカセット634,635又は手差しトレイ636の何れかより供給されたシートは、レジストローラ637を経て転写ベルト638上に吸着されて搬送される。給紙のタイミングと同期が取られて、予め感光ドラム617,621,625,629には各色のトナーが現像されており、シートの搬送と共にトナーがシートに転写される。各色のトナーが転写されたシートは、分離され、搬送ベルト639により搬送され、定着器640によってトナーがシートに定着される。定着器640を抜けたシートは、フラッパ650により一旦下方向へ導かれてシートの後端がフラッパ650を抜けた後、スイッチバックさせて排出する。これによりフェイスダウン状態で排出され、先頭頁から順にプリントしたときに正しい順となる。
尚、4つの感光ドラム617,621,625,629は、距離dをおいて、等間隔に配置されており、搬送ベルト639により、シートは一定速度vで搬送されており、このタイミング同期がなされて4つの半導体レーザ605は駆動される。
図7にモノクロ印刷機部の概観図を示す。
713はポリゴンミラーであり、4つの半導体レーザ505より発光されたレーザ光を受ける。レーザ光はミラー714,715,716を経て感光ドラム717を走査する。一方、730は黒色のトナーを供給する現像器であり、レーザ光に従い、感光ドラム717上にトナー像を形成し、トナー像がシートに転写され、出力画像を得ることができる。
シートカセット734,735及び手差しトレイ736の何れかより給紙されたシートは、レジストローラ737を経て転写ベルト738上に吸着され、搬送される。給紙のタイミングを同期が取られて、予め感光ドラム717にはトナーが現像されており、シートの搬送とともに、トナーがシートに転写される。トナーが転写されたシートは、分離され、定着器740によってトナーがシートに定着される。定着器740を抜けたシートは、フラッパ750により一旦下方向へ導かれてシートの後端がフラッパ750を抜けた後、スイッチバックさせて搬出する。これによりフェイスダウン状態で排出され、
先頭頁から順にプリントしたときに正しいページ順となる。
図8にコントローラユニット103内の文字抽出変換ブロック108の構成を示す。
図4に図示したコントローラ構成においてCPU401の内部構成回路とRAM403上にマッピングされた各領域間で以下のような処理を行う。
具体的には、同図において、801は文書画像を取り込むスキャナ回路(画像読み取り手段)、802はその文書画像を記憶するメモリ回路(データ記憶手段)803を制御するメモリコントロール回路、804は入力した文書画像の特徴により文字部の領域等を分割する領域分割回路(抽出手段)、805はその領域分割結果を記憶する領域メモリ、806は画像の特徴を抽出、比較することにより文字、記号等を認識する認識回路(認識手段)である。807はその認識結果を記憶する認識メモリ、808は辞書メモリ、809は入力情報の処理を行う情報処理回路(処理手段)で、任意の複数の文字部を選択し、選択した複数の文字部の認識結果を再構成する(文字抽出変換手段)。
810は文字部や画像を表示するモニタ等の表示装置(表示手段)、811はMOドライブ或はハードディスク等の外部記憶装置、又、画像形成装置内の内部記憶装置813は、本画像入出力装置のシステム全体の制御を司るCPU等から成るシステム制御回路であり、ROM814に記憶されたプログラムに従って全体の制御を行う。ROM814は、後述するフローチャート等、本発明に係る処理の制御プログラムを記憶している。
尚、図8に示した構成においてメモリコントロール回路803、像域分離回路804、認識回路806、情報処理回路809は、先に述べた図4におけるコントローラブロックのCPU401の回路構成に含まれている。上記回路をソフトウェア処理で行っても良い。
又、メモリ回路802、領域メモリ805、認識メモリ807、辞書メモリ808は、図4に示すRAM403上の領域にマッピングされている。
次に、図9のフローチャートにより動作を説明する。このフローチャートの動作は、システム制御回路813により実行されるものである。
先ず、システム制御回路813の制御の下で、スキャナ回路801に文書画像読み込み指示が与えられると、スキャナ回路801は文書画像をデジタル画像データ(以下、イメージデータと言う)として読み取る(ステップS901)。この読み取ったイメージデータは、メモリコントロール回路802の制御により、メモリ回路803に記憶される(ステップS902)。
そして、文書画像1枚分のイメージデータがメモリ回路803に記憶されると、システム制御回路813は、メモリコントロール回路802に指示し、読み取ったイメージデータを領域分割回路804に出力させるとともに、領域分割804に対して動作指示を与える。この結果、領域分割回路804は、入力されたイメージデータ中のイメージの種別を判定し(ステップS903)、その結果を領域メモリ805に記憶される(ステップS904)。
ここで、領域判定処理としては、例えば入力したイメージデータに対して処理速度を上げるために間引き処理が行われたり、黒画素の連続性を検出するために輪郭線追跡が行われる。そして、黒画素が連続する領域に外接する矩形を抽出し、その矩形の大きさや、その中に存在する黒画素の占める割合等でもってその領域が文字から成るイメージか、写真等の非文字部分かを判別する。
一般に、文字画像は縦書きと横書きの場合があるが、これは上記の文字と判定された矩形領域との距離を調べ、水平方向との距離が小さい場合には横書き、垂直方向の距離が小さい場合には縦書きと判定することができる。
又、写真等の場合には、矩形の大きさが或る程度以上になり、且つ、黒画素数が多い場合であり、表の場合には、矩形が整然と並んでいて、且つ、矩形内の黒画素数が占める割合が低いので容易に判断できる。
本実施の形態では、以上のようにして領域分割するものとするが、これ以外のアルゴリズムに従っても良いのは勿論である。要するに、本実施の形態では少なくとも文字イメージ部分と非文字部分とを識別できれば良い。
又、場合によっては、個々の領域をユーザが表示画面を見て、ポインティングデバイスでもって領域を設定し、種別を指定或は修正するようにしても良い。
以上の結果、領域分割回路804は領域メモリ805に例えば図12に示すようなテーブルを構築する。
図12に示すテーブルにおいて、第1フィールドは個々の領域に付けられた領域番号であり、第2フィールドはその領域(矩形)を特定する情報(左上隅と右した隅の座標)である。又、第3フィールドは個々の領域の種別が格納され、本実施形態では文字イメージであることを示す“テキスト”と、写真画像等の非文字であることを示す。“非テキスト”の2種類としている。
次に、上述の領域分割回路804による領域分割処理が完了すると、システム制御回路802は領域メモリ805を参照して、テキスト領域として判定された領域のイメージデータをメモリ回路803より読み出し(ステップS905)、そのデータを認識回路806に出力される。このとき、領域分割回路804は単にバイパスするのみである。
認識回路806は、与えられたイメージデータから文字イメージを切り出し、その切り出した文字イメージから特徴情報を抽出し、辞書メモリ808内の標準特徴情報と比較することで(ステップS906)、公知の文字認識処理を行う。
一般に、このような文字認識処理では、認識対象の文字イメージから得られる特徴情報(特徴ベクトル)と、認識辞書(辞書メモリ808)に記憶されている標準的な特徴情報との距離を求めていき、最も距離が近い標準特徴情報を有する文字(文字コード)を第1候補とし、以下、第2候補、第3候補…として出力する。このとき、最大候補はN個とし、それ以上の候補は出力しないというようにしている。
次に、認識回路806は、上記認識処理として得られた第1候補とその他の候補を認識メモリ7に出力する。このとき、システム制御回路812は、認識された文字イメージの位置情報(文書画像中のどの位置に存在した文字かを示す情報)を認識回路806に渡し、その情報も認識メモリ807に格納される(ステップS907)。この結果、認識メモリ807には図13に示すようなテーブルが構築される。
図13に示すテーブルにおいて、第1フィールドにはどの領域(図13参照)の文字かを示す情報が、第2フィールドには文字イメージの位置情報が、第3フィールドには文字コード(認識結果得られた候補文字で第1候補、第2候補…)がそれぞれ格納される。
尚、ここでは個々の文字の大きさがほぼ一定であるものとしているが、異なるサイズ文字を有する文書画像を認識する場合には、図13のテーブルにおける座標位置情報は2つ必要になる。即ち、例えば左上隅と右下隅の座標データである。
次に、上記のように文書画像中の文字領域に対する文字認識が完了すると、入力した文書画像中の文字以外と判定された領域についてはビットマップデータを、文字認識された部分に関しては認識メモリ807に記憶されたテーブルの内容をそれぞれ外部記憶装置811にファイリングする。又、文書画像の種別や位置を表している、領域メモリ805に記憶されたテーブルの内容も同時にファイリングする(ステップS908)。
ここで、文書画像が複数ある場合には、例えばスキャナー回路801に設けられた自動原稿搬送機の原稿載置センサーにより文書画像があるか否かの判断を行い、もしあれば以上述べた動作を繰り返し行う(ステップS909)。
又、不図示のキーボード等の指示を受け、他のアプリケーション等により認識した文字コード情報をプレーンテキストとして利用する場合は、外部記憶装置811より任意に選択した画像を読み出し、これを領域分割結果に基づいた画像として表示装置810に表示する処理や音声発生装置816で音声メッセージを発生させる処理は、システム制御回路813の制御の下で情報処理回路809が行う(ステップS910)。
次に、表示処理について説明する。
本実施形態における表示装置810は、図2に示した操作部の表示部とするが汎用のモニターでも良く、情報処理回路809内には表示画像を格納するバッファメモリが備えられているものとする。
非文字イメージ(写真等)についてはそのまま上記のバッファメモリに展開し、文字イメージに対しては認識結果の第1候補の文字コードに基づいて不図示のフォントメモリよりフォントデータを取り出して文字パターンを発生させ、認識メモリ7に格納されている図13に示すテーブルの位置情報及びフォントサイズに従って対応する位置に展開する。又、認識メモリ807に記憶されている座標データに基づき、文字拡大、縮小、文書の再構成を行うために座標変換を行う。この変換された座標情報を基にフォントメモリよりフォントデータを取り出す。
一方、本発明の画像形成装置では、各々のフォントデータに対応する音声データを外部記憶装置810又は内部記憶装置811に記憶していてファイリングされたデータを参照して音声を発生させ文書を読み上げることが可能である。
次に、図10のフローチャートにより音声による原稿種別メッセージ発生制御を説明する。
先ず、本発明の画像形成装置の原稿読み取り装置により原稿が読み取られる(ステップS1001)、次に読み込まれた電子データより文字抽出変換処理を行う(ステップS1002)、図9で説明のフローチャートに基づきファイリングされたデータを参照して、ファイル中に文字列か画像の領域が存在するか否かを図12のテーブルを参照することにより判定を行う(ステップS1003)。存在しない場合は白紙と判定しユーザに音声で「白紙です」とメッセージを出す(ステップS1004)。
ユーザはメッセージを確認し、原稿の表裏が正しいか、つまり原稿台又は自動原稿送り装置に正しくセットされたかどうかの注意を促すことが可能となり、もう一度読み込ませるかそのまま出力させるかをシーケンシャルに行うことができる。白紙と判定されて原稿確認を「OK」であると判断した場合はフラグ「NOTHING =1」を設定する(ステップS1006)。このフラグは後に原稿種別メッセージ発生のシーケンスで用いる。
次に、ステップS1003で白紙でないと判定された場合、つまりファイリングされたデータ中に文字列かイメージデータが含まれていると図12に示したテーブルから判断した場合(ステップS1007)は、文字列が含まれている場合は文字列フラグ「CARACTER=1」(ステップS1009)、含まれていない場合は「CARACTER=0」を設定する(ステップS1008)。
次に、ステップS1007同様ファイリングされたデータ中にイメージがないかを図12のテーブルから判定して(ステップS1010)、イメージが含まれている場合はイメージフラグ「IMAGE =1」(ステップS1012)を設定、含まれていない場合は「IMAGE =0」をセットする。
以上のフラグ設定を用い「原稿種別」フラグを読み込み(ステップS1013)、原稿種別メッセージを発生する(ステップS1014)。
図11のフローチャートによりユーザの操作フローの一例を示す。
ユーザは原稿を本画像形成装置の有する原稿読み取り装置原稿をセットてし原稿を読み取らせる(ステップS1101)、白紙か否かを判定結果に基づくメッセージを確認する(ステップS1102)、原稿に正しくセットされているか否かを確認して(ステップS1104)間違っている場合は原稿を載せ換える(ステップS1103)、原稿が正しくセットされている場合は操作部スタートボタンを押し原稿種別を発せられる音声で確認する。
このとき、図12のテーブルの第3フィールドに個々の領域の種別が格納されているので、テキスト領域についてのみ、第1のフィールドに格納された領域番号及び第2フィールドに格納された領域(矩形)を特定する情報により、バッファメモリに展開された画像に認識処理が行われた順序を表す番号を付加するとともに、文字イメージ領域を表す枠を付加した後、表示装置810に表示する。
図14は原稿画像と表示画像の関係の具体例を示したものである。同図中、1400は文書画像(若しくはメモリ回路803に記憶された画像データ)を示しており、図示のように、文書画像は写真画像と文字とが混在したものとなっている。
又、1401は表示装置810の表示内容を示し、1402はこのとき利用可能なプレーンテキストを示しており、認識処理の順序を誤ったために文脈が前後している。
そこで、不図示のキーボード等により、1403の表示内容のように表示された認識処理の順序を変更指示することによって、システム制御回路813の制御の下で情報処理回路809は外部記憶装置811に別ファイルとして記憶する。
ここで、文字コードの順序を変更するとき、例えば不図示の表の中に複数の文字が含まれている場合等、表全体の挿入位置を変更したい場合があるが、その際、表内の複数の文字部を連結させて1つの文字部として扱うことが可能であり、扱う文字部の数を削減することができる。
このようにして、外部記憶装置811に記憶された別ファイルを他のアプリケーションより読み込むことにより、文脈を正しく訂正した文字コード情報がプレーンテキストとして利用される。
図15を用い、もう少し詳しく説明する。
先ず、前記した表示装置810の表示内容に付加された認識処理が行われた順序を表す番号についてであるが、以下のようにして作成している。
図15a)には1401の表示内容に相当する805の領域メモリに構築されたテーブル内容を示しているが、これにより第1フィールドの領域番号から非テキスト領域を除いて、テキスト領域のみの領域番号を選択し、各々の順序関係を保存しながら空き番号が無くなるよう新規領域番号を設定し図15b)に示すような対応表を作成する。
この対応表において、第1フィールドは図15a)の第1フィールドにおけるテキスト領域のみの領域番号であり、第2フィールドは前記した新規領域番号であり、これが1401の表示内容に付加した認識処理が行われた順序を表す番号に相当する。
従って、前記1403の表示内容で説明したように認識処理の順番を変更し、文脈を修正する場合は、例えば、不図示のキーボード等を用いて指示することにより認識処理が行われた順序を表す新規領域番号を図15c)に示すように修正することにより行うことが可能である。ここにおいては、2番目と3番目に行われた認識処理の順番を逆転させているが、対応表の第2フィールドに対応する第1フィールドの領域番号から、図13のテーブルを参照して領域番号に対応する文字コードを抽出することができる。このようにして、修正した新規領域番号の順番で文字コードを外部記憶装置811より読み出し、1404に示すようなプレーンテキストが形成されることになる。又、前記した表内の複数の文字部を結合させて1つの文字部として扱う場合を図16により説明する。
図16a)は805の領域メモリに構築されたテーブル内容を示していて、領域番号の4〜7に対応する文字部が表内の文字部とする。
図16b)は修正前、図16c)は修正後の対応表であるが、これらを比較すると第1フィールドの4〜7に対応する文字部における第2フィールドの値が等しく変更され、しかも第1フィールドの2に対応する文字部における第2フィールドの値と順序関係が逆転している。これは表内の文字部が一括して第1フィールドの1と2の文字部の間に挿入されることを示している。
このようにして表内の複数の文字部に対して第2フィールドの値を等しくしておき、扱いを連動させることができる。但し、連動させる文字部の順序を入れ替える場合も考えられ、図16c)の対応表に第3フィールドを拡張し、表内の文字部の認識処理の順序を記述している。この拡張部分の順序を変更することで順序を変更する。
以上の結果、例えばファイリングされた文字認識結果を利用したい場合には、他のアプリケーションに移動する前に、文字部の認識結果が文脈通りになっているかを容易に認識することができ、それが満足できないものであれば、不図示のキーボード等で適宣認識結果を訂正することが可能である。
尚、上記の例では、認識結果の文字コードに基づいて文字パターンを発生させて表示したが、全画像のビットマップをファイリングすることにより、そのまま表示するようにしても良い。但し、この場合にも、認識処理が行われた順序を表す番号を付加するとともに、文字部ごとに文字イメージ領域を表す枠を付加する。
又、上記の例では、認識処理が行われた順序を数字により表し、又、文字イメージ領域を表すのに枠により囲んだが、これに限らず、順序を表すのにアルファベット等を使用したり、枠の代わりに網掛けや表示色を変えたりする等しても良い。即ち、区別できさえすれば、如何なる表示形態にしても良い。
又、上記の例では、領域分割結果に基づく画像の表示及び確認することにより、文脈を訂正した後、プレーンテキストを別ファイルとして記憶しているが、その際、同時に既にファイリングされた各テーブル内容を前記対応表を作成記憶することにより修正するようにしても良い。
又、上記の例では、領域分割結果に基づく画像を表示する例を示したが、プリント出力装置によりプリントしても良い。この場合、複数枚出力することにより、後で一括して訂正処理を行うことで可能である。
更に、本実施の形態で示した装置を汎用の情報処理装置に適用しても良い。この場合の装置構成としては、例えば図15に示すような構成となる。
図17において、1700は装置或はシステム全体を制御するCPU、1701はブートプログラムやBIOS等を記憶するROM、1702はCPU1700のワーク領域として使用するRAMであり、図8のメモリ回路803に対応するイメージ格納エリア1703、領域メモリ805に対応する領域種別エリア1504、認識メモリ807に対応する認識結果エリア1705、音声発生器1717から音声を発生するための音声データエリア1718をはじめ、以下のデータ或はプログラムが展開若しくは確保されている。
即ち、1706は一連の処理手順に対応するプログラム、1707は印刷する時に使用する出力バッファエリア、1708は制御プログラム1706をはじめとして本装置全体の制御を行うオペレーティングシステム(OS)である。
又、1709は原稿画像を読み取るためのイメージスキャナー、1710はハードディスク装置や光磁器ディスク装置等の大容量記憶装置であり、この中にはオペレーティングシステム1708も記憶されている。1711は過搬性の記憶媒体からのデータのリードを行うための装置であって、図示ではディスクドライブを有したフロッピーディスク装置である。このフロッピーディスク装置1711にセットするフロッピーディスク、若しくはハードディスク装置等の記憶装置1710の何れか一方に、上述の制御プログラム1706が格納されている。
1712は表示画面に表示するビットマップイメージを展開するためのVRAM、1713はこのVRAM1712に展開されたビットマップイメージを表示する表示器、1714は認識結果を修正するための各種情報を入力するためのキーボード、1715は表示器1713の表示画面の中で所望の位置を指定したり、各種メニューの中の1つを選択したりするためのポインティングデバイス、1716はプリンタである。1717はシステムの使用に際してユーザに音声で操作方法等を知らせるための音声発生器である。
上記構成の装置における動作は、先に説明した実施形態の動作とほぼ同じであるが、メモリコントロール回路2や領域分割回路4に相当する処理は、CPU100が制御プログラム106に従って行うことになる。
このように、本発明は、汎用の情報処理装置或はシステムに、先に説明した処理を実現するためのプログラムを外部から供給することでも達成できる。
従って、本発明は、ホストコンピュータ、インタフェース、プリンタ等の複数の機器から構成されるシステムに適用しても、複写機等の1つの機器から成る装置に適用しても良い。
又、本発明は、システム或は装置に記憶媒体に格納されたプログラムを供給することによって達成されることは言うまでもない。
図18に本発明の画像形成装置における文字抽出変換処理についてその処理手順を示す。
画像読み取り装置によって読み込まれたデータは、一時的にハードディスク等の記憶装置に圧縮データとして記憶される。本発明では、画像形成装置が非稼動時つまりユーザが本画像形成装置を使用していない時に、予め操作部200によって設定(c)で自動的にコントローラユニットにおいて記憶装置より圧縮データを読み込んできて圧縮後のデータを伸長し(a)、文字抽出変換ブロックにおいて編集可能なテキストデータを抽出し、抽出された文字とその位置情報からページ構成し(1802,1805)、元の画像データと関連づけて元の画像データとは別に記憶装置に記憶する(b)。
勿論、非稼動時以外にも適時設定で文字抽出変換処理を機能させることもできる。このとき、元の画像データへ関連づける内容として、ページとして構成された編集可能なフォーマットとなったデータとオリジナルの画像データ(1801,1804)を関連づけることは勿論のこと、画像データから抽出されたテキストデータのうちページの先頭部分又はページの代表的な文字列をファイル名とし、又、オリジナルの画像データに写真等のイメージデータが含まれるか否かの属性等を関連づける(1803,1806)。このように、画像データに関連づけられた各種情報より、例えば画像データ中に或る特定の文字列が含まれる場合は, 音声データでメッセージをユーザに対して発することで注意を促したり、画像出力を制限する等の特別な制御を施すことが可能である。
上記オリジナルデータ(1801,1804)と変換後のデータ(1802,1805)は対になって記憶することもできるし、別に記憶することもできる。又、オリジナルデータをプリンタで印刷した場合記憶装置内のデータを削除することもできるし、そのまま保存することもできる。
図19に原稿種別とフラグ、メッセージの関係を示す。
図19(A)は原稿が白紙であった場合、各フラグは「NOTHING=1」、「CHARACTER =0」、「IMAGE =0」と設定され音声データとしては図に示したように「原稿種別は白紙です」「原稿を確認してください」とメッセージが発せられる。(B)は原稿中に文字列のみ含まれている場合で各フラグは「NOTHING =0」「CHARACTER =1」「IMAGE =0」とセットされ、音声データとして「原稿種別は文字原稿です」と発せられる。(C)は原稿中に文字とイメージが混在している場合で各フラグは「NOTHING =0」「CHARACTER =1」「IMAGE =1」とセットされ、音声データとしては「原稿種別は文字写真原稿です」と発せられる。又、上記挙げた音声データは一例であり、原稿の種別が理解できれば他の音声データでも構わないものとする。
本発明は、原稿読み取り装置により読み取られた原稿の種別を判定する機能を備える画像形成装置に対して有用である。
本発明の画像形成装置の概略図である。 操作部の構成図である。 画像読み取り装置の構成図である。 コントロールユニット構成図である。 画像データの信号処理図である。 カラー印刷機の概略図である。 モノクロ印刷機の概略図である。 文字抽出部の説明図である。 文字抽出部の動作説明の一例を示すフローチャートである。 原稿種別判別によるフラグ設定の一例を示すフローチャートである。 ユーザの操作フローの一例を示すフローチャートである。 フローチャート図8の領域メモリに構築されるテーブルの内容を示す図である。 図8の認識メモリに構築されるテーブルの内容を示す図である。 原稿画像と表示画像との関係を示す説明図である。 テーブル内容と対応表の関係を示す図である。 テーブル内容と対応表の関係を示す図である。 装置の構成例を示すブロック図である。 本発明の画像形成装置における文字抽出変換処理の説明図である。 本発明の画像形成装置における音声メッセージ例を示す図である。
符号の説明
101 スキャナ
102 原稿台
103 自動原稿送り装置
104 コントローラユニット
105 印刷機
106 ハードディスク
107 音声発生ブロック
108 文字抽出変換ブロック
109 画像処理ブロック
201 LCD表示部
202 スタートキー
203 ストップキー
204 IDキー
205 リセットキー
401 CPU
402 画像処理回路
403 RAM
404 ROM
405 I/O制御回路
406 記憶装置
407 ネットワークI/F
408 操作部
409 VRAM
410 ROM
411 拡張I/F

Claims (4)

  1. 音声データを発生させる音声発生装置と、原稿を光学的に読み取り電子データに変換する画像読み取り手段と、前記画像読み取り手段により読み取られた画像データを一時記憶するデータ記憶手段と、前記画像記録手段に記憶されている画像データに基づく可視像を記録媒体上に形成する画像形成手段と、を有する画像形成装置において
    前記画像読み取り手段により読み取られた画像データよりイメージ画像と文字列を抽出し原稿種別を判別する原稿種別判別手段と、前記原稿種別判定手段の判別定結果に基いて前記音声発生装置を制御する手段を有することを特徴とする画像形成装置。
  2. 前記原稿種別判定手段において前記画像読み取り装置で読み込まれた画像中に文字列がある場合は前記音声発生装置よりその旨の音声メッセージを出力することを特徴とする請求項1記載の画像形成装置。
  3. 前記原稿種別判定手段において前記画像読み取り装置で読み込まれた画像中に文字列が無い場合は前記音声発生装置よりその旨の音声メッセージを出力することを特徴とする請求項1記載の画像形成装置。
  4. 前記原稿種別判定手段において前記画像読み取り装置で読み込まれた画像中に文字列以外の画像領域が判別された場合は前記音声発生装置よりその旨の音声メッセージを出力することを特徴とする請求項1記載の画像形成装置。
JP2004070517A 2004-03-12 2004-03-12 画像形成装置 Withdrawn JP2005260655A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004070517A JP2005260655A (ja) 2004-03-12 2004-03-12 画像形成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004070517A JP2005260655A (ja) 2004-03-12 2004-03-12 画像形成装置

Publications (1)

Publication Number Publication Date
JP2005260655A true JP2005260655A (ja) 2005-09-22

Family

ID=35085947

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004070517A Withdrawn JP2005260655A (ja) 2004-03-12 2004-03-12 画像形成装置

Country Status (1)

Country Link
JP (1) JP2005260655A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009105589A (ja) * 2007-10-23 2009-05-14 Kyocera Mita Corp 画像読取装置及び画像形成装置
JP2011130416A (ja) * 2009-11-20 2011-06-30 Ricoh Co Ltd 画像処理装置、画像処理方法およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009105589A (ja) * 2007-10-23 2009-05-14 Kyocera Mita Corp 画像読取装置及び画像形成装置
JP2011130416A (ja) * 2009-11-20 2011-06-30 Ricoh Co Ltd 画像処理装置、画像処理方法およびプログラム

Similar Documents

Publication Publication Date Title
EP2264995B1 (en) Image processing apparatus, image processing method, and computer program
JP5312277B2 (ja) 画像処理装置及び画像処理方法
US20120251004A1 (en) Image processing apparatus and image processing method
JP5972578B2 (ja) 画像処理装置、画像形成装置、プログラム、記録媒体
US20110227951A1 (en) Conference system, information processing apparatus, display method, and non-transitory computer-readable recording medium encoded with display program
JP2006238289A (ja) 表示データの変倍方法
JP5570193B2 (ja) 画像管理装置、および画像管理方法
JP4908773B2 (ja) 画像処理装置及びその制御方法、プログラム、及び記憶媒体
JP6558165B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP2007174215A (ja) 外部コントローラ、リモート操作システム及び方法
JP3179290B2 (ja) ディジタル画像形成装置
JP5019474B2 (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
US20060171513A1 (en) Information processing apparatus and data processing method
JP2008288912A (ja) 画像処理装置および画像形成装置
US8259313B2 (en) Image processing apparatus, method, and computer-readable medium storing the program thereof
JP2006196976A (ja) Ocrによる自動清書機能を持つ複写システム
JP4049169B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP2005260655A (ja) 画像形成装置
JP2009111611A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2007249774A (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP2007194713A (ja) 画像処理装置、画像処理システム、画像処理方法およびプログラム
JP6399000B2 (ja) 画像処理装置、及び画像作成プログラム
JP2006014191A (ja) 画像処理装置、画像処理方法、及びプログラム
JP4192792B2 (ja) 文書処理装置及び文書の出力プログラム
CN113271388A (zh) 图像形成装置、存储介质及图像形成系统

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060201

A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070605