JP2006196976A - Ocrによる自動清書機能を持つ複写システム - Google Patents

Ocrによる自動清書機能を持つ複写システム Download PDF

Info

Publication number
JP2006196976A
JP2006196976A JP2005003821A JP2005003821A JP2006196976A JP 2006196976 A JP2006196976 A JP 2006196976A JP 2005003821 A JP2005003821 A JP 2005003821A JP 2005003821 A JP2005003821 A JP 2005003821A JP 2006196976 A JP2006196976 A JP 2006196976A
Authority
JP
Japan
Prior art keywords
image
ocr
function
correction mode
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005003821A
Other languages
English (en)
Inventor
Hideki Sakai
秀樹 境
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005003821A priority Critical patent/JP2006196976A/ja
Publication of JP2006196976A publication Critical patent/JP2006196976A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】 身近なコピー機能にOCR機能を連動させ、その内容修正も紙ベースでコピー同様の操作で可能な印刷システムを提供すること。
【解決手段】 画像をスキャンして、画像データを入力する画像入力手段(スキャナ機能)を有し、スキャンされた画像にOCR処理を実施する手段及び、それをハードディスクなどの2次記憶装置に保存する機能を有するプリンタシステムであって、原稿をスキャンし、OCR処理した出力結果のレイアウトは、元原稿のレイアウトに準ずるようにして出力させる「手書き原稿修正モード」を有することを特徴とするシステム。
【選択図】 図5

Description

本発明は、複写機等のスキャナで読み取った画像を印刷する画像形成装置のプリントサービスを提供するにあたって、ホストコンピュータや操作パネルでの煩雑な指示をすることなく、ユーザの指示に応じて容易な操作で通常のコピー感覚でOCR処理により手書きの紙文書を、プリンタフォントにより置き換え(清書し)て印字にするような複写システムに関するものである。
図1は従来の画像形成装置での、OCR機能適用の場合の処理フローを示す図である。
従来、ホストコンピュータを用いてこのフローを実現するには、図1の「ホストでのOCR処理」に示すように、ホストコンピュータにSCSI I/FやUSBI/Fにて接続されたスキャナを介して、手書き原稿(紙原稿)のイメージを入力する。このデータを、ホストコンピュータのオペレータが、ホストコンピュータにインストールされたOCR機能を有するアプリケーションにより解析を実行し、その変換結果をホストコンピュータのアプリケーション〔例えばワープロソフト〕を用いて、プリンタドライバ経由でPDL化したデータを画像形成装置に送信することで実現できていた。但し、このOCR処理におけるイメージからテキストへの変換は必ずしも100%正確なものではないので、ホストのモニタで変換結果を確認の上、必要に応じて修正させる必要があった。
また別の処理方法として、ホストを用いず複写機能を有する画像形成装置にOCR機能を内蔵させる方法もある。このフローを実現するには、図1の「画像形成装置でのOCR処理」に示すように、画像形成装置のスキャナ機能を利用して、画像のイメージデータを取り込みOCR処理を実行しプリンタ部で印刷させる。この場合もOCR処理におけるイメージからテキストへの変換は必ずしも100%正確ではないので、画像形成装置上の操作パネルをモニタにしてその変換結果を確認の上、必要に応じて操作パネルの指示で修正させる必要があった。
図2、図3は従来の画像形成装置のハード構成を説明する図である。
図2は、複写機能を有する画像形成装置の外観を示す図である。画像入力デバイスであるスキャナ201は、原稿となる紙上の画像を照明し、CCDラインセンサ(図示せず)を走査することによって、ラスターイメージデータを生成する。
使用者が、原稿用紙を原稿フィーダ204のトレイ203にセットして、操作部202において読み取りの起動を指示すると、画像形成装置のコントローラCPUがスキャナ201に指示を与え、フィーダ203は原稿用紙を1枚ずつフィードし、スキャナ201は原稿画像の読み取り動作を行う。
操作部202はタッチパネル、もしくはタッチペン等の入力可能なデバイスを有しており、例えば読み取ったイメージの変形、加工、OCR処理後の校正の指示が可能になっている。
画像出力デバイスであるプリンタエンジン103は、ラスターイメージデータを用紙上の印刷する部分である。その方式は感光体ドラムや感光体ベルトを用いた電子写真方式、微少ノズルアレイからインクを吐出して用紙上に直接画像を印字するインクジェット方式等があるが、どの方式でも構わない。なお、プリント動作は、コントローラCPUからの指示によって起動される。
プリンタエンジン103は、異なる用紙サイズまたは異なる用紙向きを選択できるように複数の給紙段を持ち、それに対応した用紙カセット206、207、208がある。また、排紙トレイ205は、印字し終わった用紙を受けるものである。
図3は、画像形成装置の制御構成を示すブロック図である。プリンタコントローラ102は、画像入力デバイスであるスキャナ201や画像出力デバイスであるプリンタエンジン103と接続し、一方ではホストI/F308経由で、ホストとの間で印刷データや画像情報やデバイス情報の入出力をする。
CPU301は、システム全体を制御するコントローラである。RAM302は、CPU301が動作するために使用するシステムワークメモリである。また、RAM302は、画像データを一時記憶するための画像メモリでもある。ROM303は、ブートROMであり、システムのブートプログラムが格納されている。HDD304は、ハードディスクドライブで、システムソフトウェア、画像データを格納する。
操作部I/F306は、操作部(UI)202との間のインターフェースを司り、操作部202に表示する画像データを操作部202に対して出力する。また、使用者が操作部202を介して入力した情報を、CPU301に伝える役割を果たす。 ホストインタフェース308は、ホスト001に対して情報の入出力を行う。以上のデバイスがシステムバス307上に配置される。
イメージバスインターフェース(Image Bus I/F)305は、システムバス307と画像データを高速で転送する画像バス309とを接続し、データ構造を変換するバスブリッジである。 画像バス309には以下のデバイスが配置される。ラスターイメージプロセッサ(RIP)310は、ネットワークから送信されて来たPDLコードをビットマップイメージに展開する。デバイスI/F部311は、画像入出力デバイスであるスキャナ201やプリンタエンジン103とプリンタコントローラ102とを接続し、画像データの同期系/非同期系の変換を行う。
スキャナ画像処理部312は、入力画像データに対し補正、加工、編集を行う。プリンタ画像処理部313は、プリント出力画像データに対して、プリンタの補正、解像度変換等を行う。画像回転部314は画像データの回転を行う。画像圧縮部315は、多値画像データに対してはJPEG圧縮新調処理を行い、2値画像画像データに対してはJBIG、MMR、MH等の圧縮伸張処理を行う。またスキャナから入力された画像データはHDD304に保存してホスト001や操作部202からの指定で画像編集、加工や印刷実行が可能である。
OCR処理部316は入力画像データに対しOCR処理を実行しイメージを文字に認識する処理を行う。OCR処理部の中には、文字を認識する精度を設定する手段と、文字を判定するための辞書パターンも含んでいる。
又、別の従来例としては、例えば特許文献1と特許文献2をあげることが出来る。
特開平06−16471号公報 特開平05−205100号公報
近年、プリンタを利用しての読みやすい(非手書き)文書の流通があたりまえになってきている。一方、コピー機は使えるがパソコンやプリンタとなるとその操作に戸惑う人が少なからず存在する。一方でそのような人たちも読みやすい文書作成を望んでいる。そこで複写機にOCRを搭載するような提案はすでに成されてきた。しかしながらその場合でも、OCRの文字認識精度は100%ではありえず、なにがしかの修正手段を複写機にもたせねばならず、操作が煩雑になる、操作パネルに校正のためのユーザインタフェースを備えねばならないためコスト増加につながるという欠点があった。そのため身近なコピー機能にOCRを連動させ、内容修正も紙ベースで可能な複写機が求められている。
本発明は、身近なコピー機能にOCR機能を連動させ、その内容修正も紙ベースでコピー同様の操作で可能な印刷システムを提供することを目的とする。
上記課題を解決するために、本発明に係るシステムは、画像をスキャンして、画像データを入力する画像入力手段(スキャナ機能)を有し、スキャンされた画像にOCR処理を実施する手段及び、それをハードディスクなどの2次記憶装置に保存する機能を有するプリンタシステムであって、原稿をスキャンし、OCR処理した出力結果のレイアウトは、元原稿のレイアウトに準ずるようにして出力させる「手書き原稿修正モード」を有することを特徴とするシステムであって前記「手書き原稿修正モード」においてOCRで認識できなかった文字の部分を空白に置き換え出力する手段を有する。
前記「手書き原稿修正モード」において特定色のマーカや記号で指定された箇所を空白に置き換え出力する手段を有する。
前記、「手書き原稿修正モード」において、OCR処理前のスキャンデータを印刷後も保持し、次の原稿を読み取り、前後の差分だけをOCR処理する手段を有する。
前記、「手書き原稿修正モード」でのOCR処理実行時において、OCRの変換精度を可変にする手段を有する。
(作用)
係る構成において、パソコンなどの操作なしに容易にOCR機能で手書き文字をプリンタフォント化(清書)させるため、従来から複写機にOCRを搭載するような提案は成されてきた。しかし、その場合、OCRの文字認識精度は100%ではありえず、なにがしかの修正手段を複写機にもたせねばならず、操作が煩雑になったり、操作パネルに校正のためのユーザインタフェースを備えねばならないためコスト増加につながるなどという上記従来の欠点を除去できる。
本発明によれば、身近なコピー機能にOCRを連動させ、内容修正も紙ベースでコピー同様の操作感各で実行可能な印刷システムを提供することができる。
(第一の実施例)
本発明の第一の実施例を構成するハードは従来のもの(図2、3)とおなじである。なお以下に説明する「手書き原稿」というのは、「紙に印刷(もしくは書かれた)文字」であり、OCR処理で文字認識可能なイメージなら、手書き文字だけでなく、活字やプリンタフォントの両者が混在するものであっても構わない。
図4は、第一の実施例の画像形成装置での「手書き原稿修正モード」における複写工程フローを説明する図であり、図5は手書き原稿の紙ベースでの変換過程と、その修正指示をするフローを説明する図で、図6は「手書き原稿修正モード」での処理を表すフローチャート、図7は「手書き原稿修正モード」の操作部202におけるユーザインタフェースの例である。
ここで図6のフローの画像形成装置での処理は、図3のHDD304に格納されたシステムプログラムに従いCPU301の制御のもとに実行される。
以下、図4、図5と図6のフローチャート、図7を用いて説明する。
図7に示すように操作パネルから原稿のコピー動作を指示する際に「手書き原稿修正モード」の指定ができる。
図4に示すようにこのモードではコピー毎にOCR処理を実行すると共に、元のスキャンされたイメージをHDDに保存し、次のイメージとの差分だけをOCR処理の対象にするような処理を行う。
図6を用いてこの処理の詳細を説明する。本処理はコピー動作実行時に実施される。ステップ601で「手書き原稿修正モード」であるかどうかの判断を行い、そうであれば(YESの場合)ステップ602にてHDDに保持されている(前にスキャンした)画像があるかどうかをチェックする。なければ(NOなら)ステップ603で新規原稿と見なしスキャンした全イメージにOCR処理を実行し、OCR変換の結果を印字する。この時の印刷イメージは元画像の文字と認識された画像のサイズに準じて同じ大きさのフォント、文字間スペースになるようにして印刷を実施する。(図5のイメージ)
ステップ602にてHDDに保持されている画像があれば(YESなら)修正原稿と見なし、そのイメージをHDDに保存し、ステップ604にて以前から保持されているスキャンイメージ(図4の“scan image old”と“scan image new”)の差のある箇所だけをOCR対象にしてOCR変換された情報だけを置き換えて印字する。この場合も印刷イメージは元画像の文字と認識された画像のサイズに準じて同じ大きさのフォント、文字間スペースになるようにして印刷を実施し、OCR処理後古いイメージ“scan image old”は削除する。
ステップ601で「手書き原稿修正モード」でなければ、(NOの場合)ステップ605にてHDDに保持されている(前にスキャンした)画像があるかどうかをチェックし、あればステップ606にて画像を削除し、なければ処理を終えて通常のコピー動作(原稿イメージのままで複写)を実行する。
図5において前記「手書き原稿修正モード」におけるOCR変換の紙ベースの出力イメージの具体例と修正フローを説明する。
(1)「手書き原稿修正モード」において、オペレータは元原稿(手書き)をスキャンするとOCR処理が実行され、“出力結果(1)”を得る。ここでOCR機能で読み取れない(明確に文字を認識できない)箇所は空白になって出てくる。図5の例では「獄」の文字である。(なおスキャン画像は前述の通りHDDに保持される。)
(2)オペレータは、この出力された紙に対し、手書きで赤のマーカーなどの手段で、間違った箇所(図5の例では「境」)を例えば「×」で重ね書きし、空白には赤のマーカーで文字を認識しやすく書き直して(マニュアル修正A)この原稿を再コピーする。(スキャン動作+OCR処理)ここでOCR処理は、前述の通り保持された前のスキャン画像との差のある箇所だけに実施する。(高速化のため)(なお。ここの説明であげた赤のマーカーや「×」は一例であり、他の色や記号で修正させても良い。)
(3)間違った箇所は空白に置き換えられ、認識できなかった文字は認識できた“出力(2)”をオペレータは得る。
(4)再度オペレータは出力結果に、同じくマーカーで手書きで空白を埋めて(マニュアル修正B)再度コピー操作を実施する。
以上のようなフローを必要なだけ繰り返せば、操作パネルでの指示、修正なしでOCRの誤認識を訂正できる。
またここでOCRの認識レベルは可変とする。(これは図7に示す操作パネルの指示により設定可能とする。)
図7の操作パネルにおいて「厳密」にすれば読み取りにくい文字の多い場合に空白が多くなるが正確に、「ゆるめ」にすれば誤認識の恐れはあるが識字されやすい。OCRの文字認識レベルを変えることにより、ある程度読み取りの困難な文字は、無理にOCRで読み取り可能にせずに手で書くという選択も出来る。この機能はプリンタフォントが存在しない文字や、アイコン等を読ませる場合にも有効である。
(その他の実施例)
本発明に係るプログラムコード及び関連データは、フレキシブルディスク(FD)やCD−ROM中に記憶され、そこからコンピュータに供給されうる。 また、本発明の目的は、前述した実施形態の機能を実現するソフトウエア(制御プログラム)のプログラムコードを記録した記憶媒体を、図8に示すようにコンピュータに供給し、そのコンピュータの装置(CPU)が記憶媒体に格納されたプログラムコードを読出し実行することによって達成される。プログラムやデータをコンピュータに供給する方法として、図8に示すようにフレキシブルディスクFD800に記憶させてコンピュータ本体802に(フレキシブルディスクドライブ801を介して)供給する方法が一般的である。この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスクやハードディスク以外にも,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
従来のOCRを用いた処理フローの構成を示す図である。 画像形成装置の概観を示す図である。 画像形成装置の制御構成を示すブロック図である。 第一の実施例の全体構成を示す図である。 第一の実施例の紙ベースの修正例を説明する図である。 第一の実施例の処理を示すフローチャートである。 第一の実施例の操作パネルのユーザインタフェースの例を示す図である。 プログラムコードの供給方法を示す図である。
符号の説明
001 ホストコンピュータ
101 画像形成装置全体
102 プリンタコントローラ全体
103 プリンタエンジン

Claims (5)

  1. 画像をスキャンして、画像データを入力する画像入力手段(スキャナ機能)を有し、スキャンされた画像にOCR処理を実施する手段及び、それをハードディスクなどの2次記憶装置に保存する機能を有するプリンタシステムであって、原稿をスキャンし、OCR処理した出力結果のレイアウトは、元原稿のレイアウトに準ずるようにして出力させる「手書き原稿修正モード」を有することを特徴とするシステム。
  2. 前記「手書き原稿修正モード」においてOCRで認識できなかった文字の部分を空白に置き換え出力する手段を有することを特徴とする請求項1に記載のシステム。
  3. 前記「手書き原稿修正モード」において特定色のマーカや記号で指定された箇所を空白に置き換え出力する手段を有することを特徴とする請求項1に記載のシステム。
  4. 前記、「手書き原稿修正モード」において、OCR処理前のスキャンデータを印刷後も保持し、次の原稿を読み取り、前後の差分だけをOCR処理する手段を有することを特徴とする請求項1に記載のシステム。
  5. 前記、「手書き原稿修正モード」でのOCR処理実行時において、OCRの変換精度を可変にする手段を有することを特徴とする請求項1に記載のシステム。
JP2005003821A 2005-01-11 2005-01-11 Ocrによる自動清書機能を持つ複写システム Withdrawn JP2006196976A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005003821A JP2006196976A (ja) 2005-01-11 2005-01-11 Ocrによる自動清書機能を持つ複写システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005003821A JP2006196976A (ja) 2005-01-11 2005-01-11 Ocrによる自動清書機能を持つ複写システム

Publications (1)

Publication Number Publication Date
JP2006196976A true JP2006196976A (ja) 2006-07-27

Family

ID=36802728

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005003821A Withdrawn JP2006196976A (ja) 2005-01-11 2005-01-11 Ocrによる自動清書機能を持つ複写システム

Country Status (1)

Country Link
JP (1) JP2006196976A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104917914A (zh) * 2014-03-12 2015-09-16 日本冲信息株式会社 图像形成装置和图像形成方法
US9363413B2 (en) 2014-06-09 2016-06-07 Ricoh Company, Ltd. Information processing apparatus, information processing method and recording medium for distinguishing handwritten text applied to a printed document
US10855855B2 (en) 2018-05-08 2020-12-01 Kyocera Document Solutions Inc. Image processing apparatus eliminating redundancy in scanned text data
US11223727B2 (en) 2019-11-26 2022-01-11 Kyocera Document Solutions Inc. Image reading apparatus and information processing apparatus that reads documents and generates image data
US11348331B2 (en) 2020-03-10 2022-05-31 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104917914A (zh) * 2014-03-12 2015-09-16 日本冲信息株式会社 图像形成装置和图像形成方法
US9363413B2 (en) 2014-06-09 2016-06-07 Ricoh Company, Ltd. Information processing apparatus, information processing method and recording medium for distinguishing handwritten text applied to a printed document
US10855855B2 (en) 2018-05-08 2020-12-01 Kyocera Document Solutions Inc. Image processing apparatus eliminating redundancy in scanned text data
US11223727B2 (en) 2019-11-26 2022-01-11 Kyocera Document Solutions Inc. Image reading apparatus and information processing apparatus that reads documents and generates image data
US11348331B2 (en) 2020-03-10 2022-05-31 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Similar Documents

Publication Publication Date Title
JP4789516B2 (ja) 文書変換装置、文書変換方法並びに記憶媒体
CN102404478B (zh) 图像形成装置及系统、信息处理装置、图像形成方法
US8126270B2 (en) Image processing apparatus and image processing method for performing region segmentation processing
JP2007174270A (ja) 画像処理装置、画像処理方法、記憶媒体、プログラム
KR20060133493A (ko) 화상 합성 장치, 및 그를 위한 제어 방법 및 프로그램
US8179558B2 (en) Image processing apparatus, image processing method, program and storage medium constructed to generate print data including a bitmap image and attribute data of each pixel of the bitmap image
JP5570193B2 (ja) 画像管理装置、および画像管理方法
JP5594269B2 (ja) ファイル名作成装置、画像形成装置、およびファイル名作成プログラム
JP5066977B2 (ja) 画像処理装置、画像形成装置、及びプログラム
JP2016015115A (ja) 情報処理装置、情報処理方法、及び記録媒体
US8483483B2 (en) Image forming apparatus for extracting hand-written image
JP2006196976A (ja) Ocrによる自動清書機能を持つ複写システム
JP4943354B2 (ja) 情報識別装置、情報識別方法、プログラム及び記録媒体
JP2006051609A (ja) 画像処理装置および画像処理方法
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
US8259313B2 (en) Image processing apparatus, method, and computer-readable medium storing the program thereof
JP2006109142A (ja) 画像処理装置及び画像処理方式及び記憶媒体
US8059296B2 (en) Image forming apparatus that synthesizes fiber information extracted from pages of a paper medium having a plurality of pages, and an image forming apparatus control method, a program, and a storage medium relating thereto
WO2001013324A1 (fr) Procede de traitement de documents, support d'enregistrement d'un programme de traitement de documents et dispositif de traitement de documents
US20170346961A1 (en) Modified document generation
JP4906488B2 (ja) 画像形成装置、画像形成方法、及びプログラム
JP2008148263A (ja) 画像形成装置及びその制御方法
JP6119427B2 (ja) 画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラム
JP2006014191A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2006252430A (ja) 画像処理装置とフォント作成方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080401