JP2008186451A - 文書データ管理装置 - Google Patents

文書データ管理装置 Download PDF

Info

Publication number
JP2008186451A
JP2008186451A JP2008001840A JP2008001840A JP2008186451A JP 2008186451 A JP2008186451 A JP 2008186451A JP 2008001840 A JP2008001840 A JP 2008001840A JP 2008001840 A JP2008001840 A JP 2008001840A JP 2008186451 A JP2008186451 A JP 2008186451A
Authority
JP
Japan
Prior art keywords
document data
image reading
reliability
management apparatus
data management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008001840A
Other languages
English (en)
Other versions
JP2008186451A5 (ja
JP5005554B2 (ja
Inventor
Kazukuni Hirabayashi
和訓 平林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba TEC Corp
Original Assignee
Toshiba Corp
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba TEC Corp filed Critical Toshiba Corp
Publication of JP2008186451A publication Critical patent/JP2008186451A/ja
Publication of JP2008186451A5 publication Critical patent/JP2008186451A5/ja
Application granted granted Critical
Publication of JP5005554B2 publication Critical patent/JP5005554B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】画像読取装置にて読み取られて電子化された文書データの管理を行なう文書データ管理装置において、画像読取装置における画像読み取り処理の信頼性を考慮した文書データの管理を行なうことにより、当該文書データを利用する各種処理の信頼性の向上を図る。
【解決手段】画像読取装置にて読み取られて電子化された文書データを取得する文書データ取得部と、文書データ取得部にて取得された文書データに基づいて、該文書データについての画像読取装置における画像読み取り処理の信頼度を判定する信頼度判定部と、信頼度判定部にて判定された信頼度が所定の閾値よりも低い文書データについては、該文書データの保存を禁止する保存禁止部とを備えてなる。
【選択図】図1

Description

本発明は、画像読取装置にて読み取られて電子化された文書データの管理に関するものであり、特に、当該文書データを利用する各種処理の信頼性を向上させるための技術に関するものである。
従来、紙文書等の原稿を電子化するために、スキャナで紙文書をスキャンし、電子化を行なう技術が知られる。
このような文書の電子化を行なう技術において、画像読み取り処理においてユーザが望むような画像(データ)が得られているかどうかを確認する方法として、大量にスキャンした際にすべての文書がユーザの望む形になっているかどうか比較的に簡単にチェックできるようにする技術が知られる(例えば、特許文献1を参照。)。
上記従来技術では、スキャナ機器に領域分割処理を行なう機能をもたせ、原稿の写真部分と文字部分を認識できるようにし、現在の読み取りモードと原稿の種別が違っている場合にユーザにその旨を伝えてスキャン時の間違いを減らすといった処理を行なう。また、上記従来技術における評価のバリエーションとして、圧縮率をみて警告する、原稿の色のヒストグラムを検出しモノクロで読み取れるものをカラーで読み取っているといった警告を発する、またスキャナ機器にOCR機能をもたせスキャンされたデータが読み取り可能であるかといったことを判定し電子メールでまとめて注意を促す、といったものがある。
また、他の従来技術として、帳簿のフォーマットおよび内容が所定の形式であるか判定し、判定結果をネットワーク経由で通知する技術が知られる(例えば、特許文献2を参照。)。
また、この他にも、電子化された画像のサムネイルをつけユーザに確認させる技術(例えば、特許文献3を参照。)や、判定結果から何が問題となっているかといったことを通知する技術(例えば、特許文献4を参照。)が知られる。
特開2003−274080号公報 特開2005−18678号公報 特開2000−174945号公報 特開平08−223409号公報
上記従来技術では、スキャンされたデータに対して比較的取り込み状態がよい電子データとしてスキャンされたかどうか判定をして、ユーザへの確認を促すが、ユーザが確認を怠った場合などは単純に電子化されてしまう。
画像読み取り処理により電子化されたデータを利用する業務ワークフローなどが確立されている場合、例えば紙の領収書を電子化して得られた文書データを原本として電子的承認決済ワークフローで使用する場合がある。
このような場合に、明らかに間違った文字列が記入された文書の文書データや、著しく傾いた状態でスキャンされてしまった文書データがワークフローに登録されてしまうと、後の処理で問題が生じてしまう。
例えば、文書を電子化して得られた文書データが、原本として利用できないレベル(読むことができない、規定されているフォーマットと異なっている、正式な書類ではない等)であった場合、業務ワークフローの後の処理で必ず否認されるため、それまで費やされたリソースが無駄になってしまう。また場合によっては、そのような信頼性の低い文書データに基づく不正な処理が行われ、被害を受けるおそれがある。この他、可読性が著しく低いような文書データによって、ワークフローにおける処理ミスが発生してしまうといったおそれもある。
本発明は上述した問題点を解決するためになされたものであり、画像読取装置にて読み取られて電子化された文書データの管理を行なう文書データ管理装置において、画像読取装置における画像読み取り処理の信頼性を考慮した文書データの管理を行なうことにより、当該文書データを利用する各種処理の信頼性の向上を図ることのできる技術を提供することを目的とする。
上述した課題を解決するため、本発明の一態様に係る文書データ管理装置は、画像読取装置にて読み取られて電子化された文書データを取得する文書データ取得部と、前記文書データ取得部にて取得された文書データに基づいて、該文書データについての前記画像読取装置における画像読み取り処理の信頼度を判定する信頼度判定部と、前記信頼度判定部にて判定された信頼度が所定の閾値よりも低い文書データについては、該文書データの保存を禁止する保存禁止部とを備えてなることを特徴とするものである。
また、本発明の一態様に係る文書データ管理装置は、画像読取装置にて読み取られて電子化された文書データを取得する文書データ取得部と、前記文書データ取得部にて取得された文書データに基づいて、該文書データについての前記画像読取装置における画像読み取り処理の信頼度を判定する信頼度判定部と、前記文書データ取得部にて取得された文書データと、該文書データについて前記信頼度判定部にて判定された信頼度とを対応付けて所定の記憶領域に格納させる対応付け部とを備えてなることを特徴とするものである。
また、本発明の一態様に係る文書データ管理装置は、画像読取装置にて読み取られて電子化された文書データを取得する文書データ取得部と、前記文書データ取得部にて取得された文書データに基づいて、該文書データについての前記画像読取装置における画像読み取り処理の信頼度を判定する信頼度判定部と、前記信頼度判定部にて判定された信頼度が所定の閾値よりも低い場合に、該信頼度が判定された文書データについては画像読取装置における画像読み取り処理の信頼度が低い旨の通知を行なう通知部とを備えてなることを特徴とするものである。
以上に詳述したように本発明によれば画像読取装置にて読み取られて電子化された文書データの管理を行なう文書データ管理装置において、画像読取装置における画像読み取り処理の信頼性を考慮した文書データの管理を行なうことにより、当該文書データを利用する各種処理の信頼性の向上を図ることができる。
以下、本発明の実施の形態について図面を参照しつつ説明する。
(第1の実施の形態)
まず、本発明の第1の実施の形態について説明する。
図1は、本発明の第1の実施の形態による文書データ管理装置を備えた画像処理装置Mについて説明するためのシステム構成図である。画像読取装置(スキャナ)2はスキャナI/F804を通じてMFPコントローラと接続されている。画像読取装置2にてスキャンされた原稿の文書データは、HDDやメモリ、またはネットワーク上の画像ファイルサーバ4に格納される。HDDまたはROMなどからメモリにロードされるプログラムをCPU上で実行させることにより、スキャン画像のOCR解析などが実行される。このようにして解析および処理されたデータは、画像処理装置MにおけるHDD等に格納されるか、上記解析結果に応じて破棄される。ここでの解析結果等の格納領域としては、画像処理装置MにおけるHDDだけでなく、外部I/F803を介して外部機器であるPC3や画像ファイルサーバ4あるいはデータベース等が採用可能である。
また、本実施の形態による画像処理装置Mは、電子ワークフロー向けの処理モードを有している。この処理モードは、文書をスキャンして電子化する際の処理フローの流れを規定するモードである。例えば、解像度300dpi以上でかつ詳細にスキャンされているかどうかといったチェックを行なう機能を有効にするか否かの設定が可能となっている。
図2は、本実施の形態による文書データ管理装置およびこれを備えた画像処理装置Mについて説明するための機能ブロック図である。本実施の形態による画像処理装置(MFP:Multi Function Peripheral)Mは、画像読取装置2および文書データ管理装置1を備えてなる構成となっている。また、本実施の形態による文書データ管理装置1は、文書データ取得部101、信頼度判定部102、保存禁止部103、対応付け部104、通知部105、表示部106、CPU801およびMEMORY802を備えてなる構成となっている。
画像読取装置2は、ADF(Auto Document Feeder)により自動搬送される原稿または原稿台に載置される原稿の読み取り対象面の画像を光学的に読み取り、当該画像に基づく文書データを生成する。ここでの文書データとは、例えば、 PDF(Portable Document Format)、XPSDoc(XML Paper Specification Document)、JPEG、JPEC2000、TIFF,PNGなどの一般的なデータフォーマットであり、任意のメタデータを登録可能となっている。
文書データ取得部101は、画像読取装置2にて読み取られて電子化された文書データを取得する機能を有している。
信頼度判定部102は、文書データ取得部101にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトと、所定のオブジェクトとに基づいて、画像読取装置2における画像読み取り処理の信頼度をオブジェクト毎に判定する機能を有している。
また、信頼度判定部102は、文書データ取得部101にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの文字列と、該オブジェクトに対応する所定の文字列との一致率に基づいて、画像読取装置2における画像読み取り処理の信頼度を判定する。
もちろん、信頼度判定部102による信頼度の判定は、文書データに含まれるオブジェクト毎に行なうだけでなく、文書データ全体に対して総合的に行なうようにしてもよい。
保存禁止部103は、信頼度判定部102にて判定された信頼度が所定の閾値よりも低い文書データについては、該文書データの所定の記憶領域への保存や特定のワークフローシステムへのデータ登録などを禁止する機能を有している。
対応付け部104は、信頼度判定部102にて判定された信頼度が所定の閾値よりも高い場合に、文書データ取得部101にて取得された文書データと、該文書データについて信頼度判定部102にて判定された信頼度とを対応付けて所定の記憶領域に格納させる機能を有している。具体的に、対応付け部104は、信頼度判定部102にて各オブジェクトについて判定された信頼度を示す情報を、文書データ取得部101にて取得された文書データにおける各オブジェクトに対応付けて該文書データに埋め込む。なお、ここでの信頼度を示す情報とは、例えば信頼度の評価値を示すメタデータであり、信頼度を示す情報の文書データへの埋め込みとは、当該メタデータを対象となる文書データにメタデータとして付加することを意味する。
なお、文書データにおける各オブジェクトと画像読み取り処理の信頼度を示す情報との対応付けは、必ずしも文書データへの信頼度を示す情報の埋め込み処理による必要はなく、例えば文書データにおける各オブジェクトに対応づけられた画像読み取り処理の信頼度を示す情報を、文書データとは別個にMEMORY802等の記憶領域に格納するようにしてもよい(すなわち、文書データにおけるオブジェクトと信頼度との対応関係が確認できればよい)。
通知部105は、信頼度判定部102にて判定された信頼度が所定の閾値よりも低い場合に、該信頼度が判定された文書データについては画像読取装置2における画像読み取り処理の信頼度が低い旨の通知を行なう機能を有している。
表示部106は、例えば液晶ディスプレイ等から構成されており、画像処理装置Mおよび文書データ管理装置1における処理内容に関する情報を画面表示する役割を有している。
CPU801は、画像処理装置Mおよび文書データ管理装置1における各種処理を行なう役割を有しており、またMEMORY802に格納されているプログラムを実行することにより種々の機能を実現する役割も有している。MEMORY802は、例えばROMやRAM等から構成されており、画像処理装置Mおよび文書データ管理装置1において利用される種々の情報やプログラムを格納する役割を有している。
図3は、本実施の形態による文書データ管理装置1における処理の詳細について説明するためのフローチャートである。
本実施の形態では画像読取装置2にてスキャンする原稿が領収書である場合を想定している。もちろん、本実施の形態に適用可能な原稿は領収書に限ったものではなく、特定用途のフォーマットでも同様な処理を行なうことが可能なことは言うまでもない。ここでの特定用途のフォーマットとしては、例えば発注書、納品書、請求書、業務用申請書類フォーマット等が挙げられる。
まず、画像処理装置Mは、処理モードのチェックを行ない(S101)、読み取り原稿の読み取り処理に信頼性が要求される場合(ワークフロー向けモードである場合)(S101,Yes)、ユーザ認証を行なう(S102)。ユーザが認証されたことを受けて、スキャン(S103)されたデータに対して、信頼度判定部102がレイアウト解析(S104)、意味解析(S105)およびOCR解析(S106)等を行ない、スキャンされた画像の内容が特定のフォーマットであるかどうか判定する(S107)。
ここでは、領収書(図4参照)のようなフォーマットであった場合を想定する。領収書では一般的に領収書の文字、発行された日付、宛名、但し書き、金額、発行元の住所電話番号などが記載されている。画像処理装置Mにおけるワークフロー向けモードでスキャンされたとき、信頼度判定部102は、既に登録されているフォーマットであるかどうか判定する(S107)。判定方法としては、まず、スキャンされた画像に対して信頼度判定部102にてレイアウト解析を行ない(S104)、画像中の要素を分解する。図4に示す領収書の画像に対してレイアウト解析した場合のレイアウト情報の一例を図5に示す。図5に示す例では、オブジェクトO1〜O6の6つのオブジェクトが抽出されている。次に、信頼度判定部102にて各ブロックでの意味解析を行ない、特定フォーマットであるか判定する(S105)。ここでの意味解析は、例えば「領収書」の文字は画像の上部にあり書体の大きさが大きいため、「タイトル」であるといった解析を行なう。続いて、信頼度判定部102は、その領域に関してOCR処理を行ない(S106)、OCR処理の結果に基いて、予め登録してあるキーワード(辞書などで登録されている語句)であるかどうか推測する。また「宛名」、「但し」などのキーワードに基づいて、領収書フォーマットであることを推測することも可能である。
本実施の形態では、文書データが「領収書」のものであると判定する(S107,Yes)と同時に、OCR処理の結果をMEMORY802に保持しておき、対応付け部104により、スキャンされたデータに対してOCR結果を数値化した情報(スキャン処理の信頼度を示す情報)をメタデータとして埋め込む(S112)。
図6は、対応付け部104により文書データに埋め込む情報の一例を示す図である。OCR結果の数値化については、業務フローの処理上、宛名が固定でなければならない場合がある。例えば、宛名は常に「○○株式会社」という書式でなければならず、「○○会社(株)」といったような書式の宛名では業務フロー上認められないといった規則である。この規則をあらかじめ画像処理装置Mやデータベース等に登録しておき、この規則とOCR解析の結果を判定し(S109)、文字がマッチする数に応じて数値を算出する(S110)。100%マッチしている場合100点を満点として点数付けすることでもよいし、割合で表現してもよく、作成された電子データに対して、何らかの指標をメタデータとして埋め込む。ここでは、S102にてユーザ認証された際に取得されたユーザ情報も、メタデータとして電子ファイルに付加する。
その後、信頼度判定部102は、予め設定されている閾値と評価値(信頼度を示す情報)とを比較し、例えば60点未満のもの(S111,No)については、表示部106にて図7のような画面表示を行ない、強制的に文書データの保存を中止する(S113)。
一方、スキャン処理の評価値が閾値以上である場合(S111,Yes)、当該評価値をメタデータとして文書データに埋め込み、MEMORY802等の所定の記憶領域に格納する(S114)。
文書データが特定のフォーマットの原稿をスキャンしたものでないと判定された場合には(S107,No)、通常のスキャン処理として読み取り画像のデータを所定の記憶領域に保存する(S108)。
OCR処理は100%の精度を保証するものではないが、このような構成によれば、電子的なワークフローで本来承認されるはずのないデータが流れてしまうことを防止することができる。
(第2の実施の形態)
続いて、本発明の第2の実施の形態について説明する。
本実施の形態は、上述の第1の実施の形態の変形例であり、その基本的な装置構成は第1の実施の形態と同様である。本実施の形態と第1の実施の形態とは、その処理の流れの一部が異なっている。
図8は、本発明の第2の実施の形態による文書データ管理装置における処理の流れを示すフローチャートである。なお、同図に示すフローチャートにおいて、S201〜S208、S214〜S217は、図3におけるS101〜S108、S111〜S114と同様の処理であるため、説明は割愛する。
本実施の形態では、第1の実施の形態で行なったような解析処理を、文書データにおける他の構成要素に対しても行なうことが可能とする。領収書を例にすると日付が記載されているかどうかを判定(S209)して点数付けを行なう。日付があり(S209,Yes)、OCR結果で日付として判別できるのであれば(S210)、過去の判定結果を参照して比較的高得点を付加する。またOCR結果でそれが日付として判別できなければその結果に応じて評価点をつける(S211)。
この他、認識された日付が、現在の日付に対して異常に古い日付となっているかどうかといった点も判定する(S212)。この場合、業務フローで規定されている受付期間内の文書であるかどうかといったことを判定し、期間内ではない場合には低い得点を付加する(S213)。このような判定を行なうことで、後の処理での無駄な手間を削減することが可能となる。
(第3の実施の形態)
続いて、本発明の第3の実施の形態について説明する。
本実施の形態は、上述の第1の実施の形態の変形例であり、その基本的な装置構成は第1の実施の形態と同様である。本実施の形態と第1の実施の形態とは、その処理の流れの一部が異なっている。
図9は、本発明の第3の実施の形態による文書データ管理装置における処理の流れを示すフローチャートである。なお、同図に示すフローチャートにおいて、S301〜S308、S314〜S317は、図3におけるS101〜S108、S111〜S114と同様の処理であるため、説明は割愛する。
例えば、3万円未満の領収書でなければ電子的ワークフローで処理することができないといった規則がある場合、信頼度判定部102によって、レイアウト解析および意味解析処理を行ない、金額の文字列であると推定(S309,S310)されたデータを、あらかじめ定めたキーワードと比較して評価点を算出する(S311)。また、当該金額の項目が所定の金額の範囲内の金額となっているかを判定し(S312)、所定の金額の範囲内でない場合には、領収書を電子化し電子ワークフローに流すことを拒否し、所定の金額の範囲内であれば評価点を付加する。このような構成とするにより、業務フロー上の処理負担を軽減させることができ、リソースの節約などの効果を奏することができる。
(第4の実施の形態)
続いて、本発明の第4の実施の形態について説明する。
本実施の形態は、上述の第1の実施の形態の変形例であり、その基本的な装置構成は第1の実施の形態と同様である。本実施の形態と第1の実施の形態とは、その処理の流れの一部が異なっている。
図10は、本発明の第4の実施の形態による文書データ管理装置における処理の流れを示すフローチャートである。なお、同図に示すフローチャートにおいて、S401〜S408、S412〜S415は、図3におけるS101〜S108、S111〜S114と同様の処理であるため、説明は割愛する。
業務ワークフロー上で領収書を処理する場合に、「但し書き」が所定の書式で記載されていないと受理されない場合がある。一般的に、「品代」「お品代」では受理されず、具体的な内容を記入しなければならない。本実施の形態では、点数付けの対象として但し書きの状態をチェックする方法を示す。
レイアウト解析および意味解析処理によって「但し書き」の文字列であると推定された(S409,Yes)データを、あらかじめ定めたキーワード(ここでは「書籍代」、「宿泊費」など。「品代」と言ったような抽象的ではないキーワード)と比較し(S410)、文字列マッチングの結果から点数を算出する(S411)。
このような構成とすることにより、業務フロー上の処理負担の軽減を図ることができ、リソースの節約などの効果を奏することができる。
(第5の実施の形態)
続いて、本発明の第5の実施の形態について説明する。
本実施の形態は、上述の第1の実施の形態の変形例であり、その基本的な装置構成は第1の実施の形態と同様である。本実施の形態と第1の実施の形態とは、その処理の流れの一部が異なっている。
図11は、本発明の第5の実施の形態による文書データ管理装置における処理の流れを示すフローチャートである。なお、同図に示すフローチャートにおいて、S501〜S508、S515〜S518は、図3におけるS101〜S108、S111〜S114と同様の処理であるため、説明は割愛する。
本実施の形態における処理での点数付けは、レイアウト解析により抽出されるそれぞれの項目ごとに行なってもよいし、各項目に対して重みのデータを設定しておき、評価点に各項目の重み値を掛け合わせた数値を最終的な点数としてもよい。
レイアウト解析および意味解析処理によって「但し書き」の文字列があると判定された(S509,Yes)文書データにおいて、「宛名」(S510)、「日付」(S511)、「但し書き」(S512)および「金額」(S513)を所定のデータと比較し、その比較結果に基づいて、「宛名」、「日付」、「但し書き」および「金額」の項目それぞれの評価点を算出する(S514)。
本実施の形態では、最終的な評価点を文書データに対してメタデータとして埋め込むとともに、個々の項目の点数とそれぞれの項目内容とを同時に埋め込む。
なお、本実施の形態では領収書を例としたが、領収書でなくとも特定フォーマットの仕様に従って、必要な項目が記載されているがどうかマスタとなるデータと比較して点数付け(数値化)する構成であればよい。
例えば、発注文書であれば「品名」、「個数」、「単価」、「合計金額」、「発注先」、「納期」といったキーワードが重要になり、紙文書からスキャンした文書データを電子的な発注業務ワークフローで利用するような場合に、このようなキーワードに基づく評価点が有用になる。
このように、本実施の形態による文書データ管理装置での信頼度判定部102は、文書データ取得部101にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの文字列と、該オブジェクトの種類に応じた所定のフォーマットとに基づいて(例えば、OCR結果の文字列がどの程度、日付、金額、などの規則的なフォーマットであると認識できるか否かに基づいて)、画像読取装置2における画像読み取り処理の信頼度を判定する構成となっている。
(第6の実施の形態)
続いて、本発明の第6の実施の形態について説明する。
本実施の形態は、上述の第1の実施の形態の変形例であり、その基本的な装置構成は第1の実施の形態と同様である。本実施の形態と第1の実施の形態とは、その処理の流れの一部が異なっている。
図12は、本発明の第6の実施の形態による文書データ管理装置における処理の流れを示すフローチャートである。なお、同図に示すフローチャートにおいて、S601〜S603、S606、S607〜S610は、図3におけるS101〜S103、S108、S111〜S114と同様の処理であるため、説明は割愛する。
本実施の形態では、信頼度判定部102による評価点の算出に関して、文字情報のマッチングだけではなく、入力画像の質といった点でも判定を行ない点数付けを行なう。
本実施の形態における信頼度判定部102は、「ワークフロー向けモード」において(S601,Yes)スキャンをした場合(S603)に、文書データの傾き(文書データ内のオブジェクトの傾き)を算出する(S604)。
算出方法としてはOCR機能で印刷文字列を処理する際に一般的な文字を抽出しその文字の傾き具合で入力画像の傾きを算出できる。または読み込み時に紙サイズを確かめる際に原稿の傾きを算出する。点数付けは傾きの度合いによって算出する(S605)。例えば、Y軸を基準にしたときに、上部の端と下部の端の傾きが0度に近ければ「100点」とする。図13および図14に、オブジェクトあるいは文書データ全体がY軸に対して角度θだけ傾斜している文書データの例を示す。
本実施の形態における処理と、上述の各実施の形態における処理とを組み合わせることにより、ワークフロー上での無駄な処理を省き、後の解析(レイアウト解析、OCR解析)などを行なう時に高精度な解析を行なわせることができる。
また、文書データの傾斜に限らず、文書データ全体の位置ずれについても同様に判定を行なうことにより、より高精度な解析処理を実現することができる。
以上のように、本実施の形態における信頼度判定部102は、文書データ取得部101にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの画像上における位置の該オブジェクトに対応する所定の配置位置からのずれ量に基づいて、画像読取装置2における画像読み取り処理の信頼度を判定する機能を有している。
(第7の実施の形態)
続いて、本発明の第7の実施の形態について説明する。
本実施の形態は、上述の第1の実施の形態の変形例であり、その基本的な装置構成は第1の実施の形態と同様である。本実施の形態と第1の実施の形態とは、その処理の流れの一部が異なっている。
図15は、本発明の第7の実施の形態による文書データ管理装置における処理の流れを示すフローチャートである。なお、同図に示すフローチャートにおいて、S701〜S713は、図3におけるS101〜S113と同様の処理であるため、説明は割愛する。
上述の各実施の形態では、所定の記憶領域あるいは文書データ自体に点数(評価データ)を埋め込んで保存する構成としているが、本実施の形態では、記憶領域に保存するのではなく、例えばWebService等を利用して、作成された電子データをワークフローシステムにダイレクトに登録する(S714)構成となっている。
(第8の実施の形態)
続いて、本発明の第8の実施の形態について説明する。
本実施の形態は、上述の第1の実施の形態の変形例であり、その基本的な装置構成は第1の実施の形態と同様である。本実施の形態と第1の実施の形態とは、その処理の流れの一部が異なっている。
図16は、本発明の第8の実施の形態による文書データ管理装置における処理の流れを示すフローチャートである。
本実施の形態による文書データ管理装置は、ワークフロー向け(スキャン処理の信頼度の高い文書データが要求される条件)ではなく、一般的な文書のスキャン処理(S801)に関してもOCR解析を行ない(S802)、その判定結果をメタデータとして電子データに付加する。
また、OCR処理や読み込み装置によって画像のズレを算出し(S803)、このズレの量によっても点数をつけ(S804)、メタデータとして文書データに付加する(S805)構成となっている。
本実施の形態により、スキャンされた文書データを検索する際にOCR結果が良好なもの、きれいにスキャンできているもの、といったような検索が可能になり、文書データの管理を行なう上での利便性の向上を図ることができる。
図17は、本実施の形態による文書データ管理装置における大まかな処理(文書データ管理方法)の流れについて説明するためのフローチャートである。
まず、文書データ取得部101は、画像読取装置2にて読み取られた画像の文書データを取得する(文書データ取得ステップ)(S901)。
次に、信頼度判定部102は、文書データ取得部101にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトと、所定のオブジェクトとに基づいて、画像読取装置2における画像読み取り処理の信頼度をオブジェクト毎に判定する(信頼度判定ステップ)(S902)。
具体的に、信頼度判定部102は、文書データ取得部101にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの文字列と、該オブジェクトに対応する所定の文字列との一致率に基づいて、画像読取装置2における画像読み取り処理の信頼度を判定する機能を有している。
信頼度判定部102は、文書データ取得部101にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの文字列と、該オブジェクトの種類に応じた所定のフォーマットとに基づいて、画像読取装置2における画像読み取り処理の信頼度を判定する機能を有している。
また、信頼度判定部102は、文書データ取得部101にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの画像上における位置の該オブジェクトに対応する所定の配置位置からのずれ量に基づいて、画像読取装置2における画像読み取り処理の信頼度を判定することもできる。ここで、信頼度判定部102は、文書データ取得部101にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの文字列の傾斜角度に基づいて、画像読取装置2における画像読み取り処理の信頼度を判定するようにしてもよい。
もちろん、信頼度判定部102による信頼度の判定は、文書データに含まれるオブジェクト毎に行なうだけでなく、文書データの全体的な内容に対して総合的に行なうようにしてもよい。
次に、保存禁止部103は、信頼度判定部102にて判定された信頼度が所定の閾値よりも低い文書データについては(S903,No)、該文書データの保存を禁止する(保存禁止ステップ)(S904)。
対応付け部104は、信頼度判定部102にて判定された信頼度が所定の閾値よりも高い場合に(S903,Yes)、文書データ取得部101にて取得された文書データと、該文書データについて信頼度判定部102にて判定された信頼度とを対応付けて所定の記憶領域に格納させる(対応付けステップ)(S905)。
ここで、対応付け部104は、信頼度判定部102にて各オブジェクトについて判定された信頼度を、文書データ取得部101にて取得された文書データにおける各オブジェクトに対応付けて該文書データに埋め込む構成となっている。
通知部105は、信頼度判定部102にて判定された信頼度が所定の閾値よりも低い場合に(S903,No)、該信頼度が判定された文書データについては画像読取装置2における画像読み取り処理の信頼度が低い旨の通知を行なう(通知ステップ)(S906)。
上述の文書データ管理装置での処理における各ステップは、MEMORY801に格納されている文書データ管理プログラムをCPU801に実行させることにより実現されるものである。
本実施の形態では装置内部に発明を実施する機能が予め記録されている場合で説明をしたが、これに限らず同様の機能をネットワークから装置にダウンロードしても良いし、同様の機能を記録媒体に記憶させたものを装置にインストールしてもよい。記録媒体としては、CD−ROM等プログラムを記憶でき、かつ装置が読み取り可能な記録媒体であれば、その形態は何れの形態であっても良い。またこのように予めインストールやダウンロードにより得る機能は装置内部のOS(オペレーティング・システム)等と共働してその機能を実現させるものであってもよい。
このように、本発明の各実施の形態は、スキャン時に紙文書が特定のフォーマットであるか、またスキャンされたデータが望む形になっているかどうかを判定し、判定結果によってユーザの設定によって電子化することを装置で拒むことができる構成となっている。なお、仮に電子化された場合でも、後の処理でも信頼性のないデータであること、またはどの程度信頼するにあたるかどうかを自動的または後から確認できるように、信頼性の度合い(点数)を数値として電子データに直接付加することも可能である。
従来の方法では、メールなどの媒体を通じて結果だけが判るが、ユーザ側からするとさらに対象となるデータを探し出さなければならなく大変である。本発明では一般的なスキャン文書に対しても、スキャンされた文書データに正確に、読むことができるレベルで取り込めたのかどうかの指標をメタデータとして付加することで、信頼性の高いまたは低いデータをメタデータ検索によって直接探し出すことができる。
なお、上述の実施の形態では、文書データ管理装置1が画像処理装置Mの内部に配置されている例を挙げたが、必ずしもこの構成に限られるものではなく、文書データ管理装置1において結果として原稿からスキャンされた文書データを取得可能な構成であれば、本発明を適用可能である。
また上述の実施の形態では、画像読取装置2における画像読み取り処理の信頼度の判定を画像処理装置M内で行なう構成となっているが、これに限られるものではなく、画像処理装置Mと通信可能に接続された外部機器上で実行するようにしてもよい。同様に、信頼度判定部102における画像読み取り処理の信頼度の判定に用いる所定のデータも、必ずしも文書データ管理装置1あるいは画像処理装置M内に保持されている必要はなく、必要に応じて外部機器から取得するようにすることもできる。
また、文書データに含まれる文字列のオブジェクトと所定の文字列との一致率に基いて、評価値を算出する際に、必ずしも対象となる文字列の全体について一致率を求める必要はなく、例えば「AAA株式会社」の場合に「AAA」という文字列部分についてのみ一致率を求めるようにすることで、読み取り内容の信頼性をより高精度に判定することができる。
このように、上述の実施の形態では、紙文書をスキャンする時点で、作成される電子データが所定のワークフローに登録するのに適した形式であるかチェックを行ない、信頼性の度合いとなるデータを対象の電子データに直接付加する構成となっている。このようにして信頼性の度合いを示す情報が付加されたデータを参照して電子化するか否かを自動的に判定することで、後にそのデータを利用する際の手間を削減できる。
また、スキャン処理の信頼性を示すメタデータを電子データ本体に埋め込む場合、当該電子データを検索するときの指標として、スキャン処理の信頼度の点数が高いものだけ抽出したり、低いものだけを抽出したりすることが可能になり、電子データの管理の自由度を向上させることができる。
本発明を特定の態様により詳細に説明したが、本発明の精神および範囲を逸脱しないかぎり、様々な変更および改質がなされ得ることは、当業者には自明であろう。
本発明の第1の実施の形態による文書データ管理装置を備えた画像処理装置Mについて説明するためのシステム構成図である。 本実施の形態による文書データ管理装置およびこれを備えた画像処理装置Mについて説明するための機能ブロック図である。 本実施の形態による文書データ管理装置1における処理の詳細について説明するためのフローチャートである。 領収書のフォーマットについて説明するための図である。 領収書の画像に対してレイアウト解析した場合のレイアウト情報の一例を示す図である。 対応付け部104により文書データに埋め込んだ情報の一例を示す図である。 表示部106における画面表示の一例を示す図である。 本発明の第2の実施の形態による文書データ管理装置における処理の流れを示すフローチャートである。 本発明の第3の実施の形態による文書データ管理装置における処理の流れを示すフローチャートである。 本発明の第4の実施の形態による文書データ管理装置における処理の流れを示すフローチャートである。 本発明の第5の実施の形態による文書データ管理装置における処理の流れを示すフローチャートである。 本発明の第6の実施の形態による文書データ管理装置における処理の流れを示すフローチャートである。 オブジェクトあるいは文書データ全体が傾斜している文書データの例を示す図である。 オブジェクトあるいは文書データ全体が傾斜している文書データの例を示す図である。 本発明の第7の実施の形態による文書データ管理装置における処理の流れを示すフローチャートである。 本発明の第8の実施の形態による文書データ管理装置における処理の流れを示すフローチャートである。 本実施の形態による文書データ管理装置における大まかな処理(文書データ管理方法)の流れについて説明するためのフローチャートである。
符号の説明
1 文書データ管理装置、101 文書データ取得部、102 信頼度判定部、103 保存禁止部、104 対応付け部、105 通知部、106 表示部、801 CPU、802 MEMORY。

Claims (20)

  1. 画像読取装置にて読み取られて電子化された文書データを取得する文書データ取得部と、
    前記文書データ取得部にて取得された文書データに基づいて、該文書データについての前記画像読取装置における画像読み取り処理の信頼度を判定する信頼度判定部と、
    前記信頼度判定部にて判定された信頼度が所定の閾値よりも低い文書データについては、該文書データの保存を禁止する保存禁止部と
    を備えてなる文書データ管理装置。
  2. 請求項1に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトと、所定のオブジェクトとに基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
  3. 請求項1に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの文字列と、該オブジェクトに対応する所定の文字列との一致率に基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
  4. 請求項1に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの文字列と、該オブジェクトの種類に応じた所定のフォーマットとに基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
  5. 請求項1に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの画像上における位置の該オブジェクトに対応する所定の配置位置からのずれ量に基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
  6. 請求項1に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの文字列の傾斜角度に基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
  7. 画像読取装置にて読み取られて電子化された文書データを取得する文書データ取得部と、
    前記文書データ取得部にて取得された文書データに基づいて、該文書データについての前記画像読取装置における画像読み取り処理の信頼度を判定する信頼度判定部と、
    前記文書データ取得部にて取得された文書データと、該文書データについて前記信頼度判定部にて判定された信頼度とを対応付けて所定の記憶領域に格納させる対応付け部と
    を備えてなる文書データ管理装置。
  8. 請求項7に記載の文書データ管理装置において、
    前記対応付け部は、前記信頼度判定部にて判定された信頼度が所定の閾値よりも高い場合に、前記文書データ取得部にて取得された文書データと、該文書データについて前記信頼度判定部にて判定された信頼度とを対応付けて所定の記憶領域に格納させる文書データ管理装置。
  9. 請求項7に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトと、所定のオブジェクトとに基づいて、前記画像読取装置における画像読み取り処理の信頼度をオブジェクト毎に判定するものであり、
    前記対応付け部は、前記信頼度判定部にて各オブジェクトについて判定された信頼度を、前記文書データ取得部にて取得された文書データにおける各オブジェクトに対応付けて該文書データに埋め込む文書データ管理装置。
  10. 請求項7に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトと、所定のオブジェクトとに基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
  11. 請求項7に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの文字列と、該オブジェクトに対応する所定の文字列との一致率に基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
  12. 請求項7に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの文字列と、該オブジェクトの種類に応じた所定のフォーマットとに基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
  13. 請求項7に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの画像上における位置の該オブジェクトに対応する所定の配置位置からのずれ量に基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
  14. 請求項7に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの文字列の傾斜角度に基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
  15. 画像読取装置にて読み取られて電子化された文書データを取得する文書データ取得部と、
    前記文書データ取得部にて取得された文書データに基づいて、該文書データについての前記画像読取装置における画像読み取り処理の信頼度を判定する信頼度判定部と、
    前記信頼度判定部にて判定された信頼度が所定の閾値よりも低い場合に、該信頼度が判定された文書データについては画像読取装置における画像読み取り処理の信頼度が低い旨の通知を行なう通知部と
    を備えてなる文書データ管理装置。
  16. 請求項15に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトと、所定のオブジェクトとに基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
  17. 請求項15に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの文字列と、該オブジェクトに対応する所定の文字列との一致率に基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
  18. 請求項15に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの文字列と、該オブジェクトの種類に応じた所定のフォーマットとに基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
  19. 請求項15に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの画像上における位置の該オブジェクトに対応する所定の配置位置からのずれ量に基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
  20. 請求項15に記載の文書データ管理装置において、
    前記信頼度判定部は、前記文書データ取得部にて取得された文書データに対してレイアウト解析を行ない、該レイアウト解析により抽出されるオブジェクトの文字列の傾斜角度に基づいて、前記画像読取装置における画像読み取り処理の信頼度を判定する文書データ管理装置。
JP2008001840A 2007-01-29 2008-01-09 文書データ管理装置 Expired - Fee Related JP5005554B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/668,184 2007-01-29
US11/668,184 US8228522B2 (en) 2007-01-29 2007-01-29 Document data management apparatus to manage document data read and digitized by an image reading apparatus and a technique to improve reliability of various processing using document data

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2010058199A Division JP5005787B2 (ja) 2007-01-29 2010-03-15 文書データ管理装置

Publications (3)

Publication Number Publication Date
JP2008186451A true JP2008186451A (ja) 2008-08-14
JP2008186451A5 JP2008186451A5 (ja) 2010-04-30
JP5005554B2 JP5005554B2 (ja) 2012-08-22

Family

ID=39667592

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008001840A Expired - Fee Related JP5005554B2 (ja) 2007-01-29 2008-01-09 文書データ管理装置
JP2010058199A Expired - Fee Related JP5005787B2 (ja) 2007-01-29 2010-03-15 文書データ管理装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2010058199A Expired - Fee Related JP5005787B2 (ja) 2007-01-29 2010-03-15 文書データ管理装置

Country Status (2)

Country Link
US (1) US8228522B2 (ja)
JP (2) JP5005554B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013069168A (ja) * 2011-09-22 2013-04-18 Toshiba Corp 画像管理システム、画像管理プログラム及び画像管理方法
JP6802417B1 (ja) * 2020-09-03 2020-12-16 ファーストアカウンティング株式会社 データ処理装置、データ処理方法及びプログラム
US11012584B2 (en) 2018-10-18 2021-05-18 Sharp Kabushiki Kaisha Image forming apparatus, method of processing image, and recording medium storing image processing program
WO2023032802A1 (ja) * 2021-09-01 2023-03-09 株式会社KPMG Ignition Tokyo アノテーション支援装置、アノテーション支援方法、アノテーション支援プログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7955754B2 (en) 2004-07-20 2011-06-07 GM Global Technology Operations LLC Enhanced stability bipolar plate
JP5448766B2 (ja) * 2009-12-08 2014-03-19 キヤノン株式会社 画像処理装置、画像処理装置の制御方法、プログラム
CN104243759B (zh) * 2013-06-19 2018-07-13 英华达(上海)科技有限公司 扫描处理系统及其方法
EP2988259A1 (en) * 2014-08-22 2016-02-24 Accenture Global Services Limited Intelligent receipt scanning and analysis
US11972197B2 (en) * 2018-08-27 2024-04-30 Kyocera Document Solutions Inc. OCR system
JP2022032145A (ja) * 2020-08-11 2022-02-25 株式会社リコー 情報処理システム、処理実行システム、処理実行方法、プログラム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0535914A (ja) * 1991-05-02 1993-02-12 Ricoh Co Ltd 画像傾き検出方法
JPH07295710A (ja) * 1994-04-20 1995-11-10 Kazuo Kobayashi データ入力方法およびその装置
JP2001265811A (ja) * 2000-03-22 2001-09-28 Toshiba Corp 画像検索システムおよび画像検索方法
JP2002077468A (ja) * 2000-09-04 2002-03-15 Nippon Telegraph & Telephone East Corp 画像データの品質チェック方法および品質チェックプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002358481A (ja) * 2001-06-01 2002-12-13 Ricoh Elemex Corp 画像処理装置
JP2004322081A (ja) * 2003-04-28 2004-11-18 Internatl Business Mach Corp <Ibm> イメージ品質に基づいてドキュメント・イメージをソートするシステム及び方法
JP2006079571A (ja) * 2004-09-07 2006-03-23 Soar System Inc プリンタ印刷照合検査装置
JP2007004319A (ja) * 2005-06-22 2007-01-11 Fuji Xerox Co Ltd 教材処理装置、教材処理方法および教材処理プログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5729745B2 (ja) * 1974-09-25 1982-06-24
DE3720489A1 (de) * 1987-06-20 1988-12-29 Sood Ralf A Verfahren zum lesen von text- und druckvorlagen
US5359677A (en) * 1990-12-11 1994-10-25 Sharp Kabushiki Kaisha Image reader and facsimile machine using such image reader
JP3445394B2 (ja) * 1993-12-17 2003-09-08 ゼロックス・コーポレーション 少なくとも二つのイメージセクションの比較方法
JP2734386B2 (ja) * 1994-12-20 1998-03-30 日本電気株式会社 文字列読み取り装置
JP3008908B2 (ja) * 1997-11-10 2000-02-14 日本電気株式会社 文字切り出し装置および文字切り出し方式
JPH11341292A (ja) * 1998-05-29 1999-12-10 Canon Inc 画像処理装置及び方法及び記憶媒体
JP4742404B2 (ja) * 2000-05-17 2011-08-10 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
US7289685B1 (en) 2002-04-04 2007-10-30 Ricoh Co., Ltd. Paper based method for collecting digital data
US20030198386A1 (en) * 2002-04-19 2003-10-23 Huitao Luo System and method for identifying and extracting character strings from captured image data
JP2005018678A (ja) 2003-06-30 2005-01-20 Casio Comput Co Ltd 帳票データ入力処理装置、帳票データ入力処理方法及びプログラム
JP4495432B2 (ja) * 2003-09-29 2010-07-07 キヤノン電子株式会社 画像処理システム、その制御方法及びプログラム
JP2005301793A (ja) 2004-04-14 2005-10-27 Oki Electric Ind Co Ltd Ocr評価システム
US20070035780A1 (en) * 2005-08-02 2007-02-15 Kabushiki Kaisha Toshiba System and method for defining characteristic data of a scanned document
US20070214177A1 (en) * 2006-03-10 2007-09-13 Kabushiki Kaisha Toshiba Document management system, program and method

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0535914A (ja) * 1991-05-02 1993-02-12 Ricoh Co Ltd 画像傾き検出方法
JPH07295710A (ja) * 1994-04-20 1995-11-10 Kazuo Kobayashi データ入力方法およびその装置
JP2001265811A (ja) * 2000-03-22 2001-09-28 Toshiba Corp 画像検索システムおよび画像検索方法
JP2002077468A (ja) * 2000-09-04 2002-03-15 Nippon Telegraph & Telephone East Corp 画像データの品質チェック方法および品質チェックプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002358481A (ja) * 2001-06-01 2002-12-13 Ricoh Elemex Corp 画像処理装置
JP2004322081A (ja) * 2003-04-28 2004-11-18 Internatl Business Mach Corp <Ibm> イメージ品質に基づいてドキュメント・イメージをソートするシステム及び方法
JP2006079571A (ja) * 2004-09-07 2006-03-23 Soar System Inc プリンタ印刷照合検査装置
JP2007004319A (ja) * 2005-06-22 2007-01-11 Fuji Xerox Co Ltd 教材処理装置、教材処理方法および教材処理プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013069168A (ja) * 2011-09-22 2013-04-18 Toshiba Corp 画像管理システム、画像管理プログラム及び画像管理方法
US11012584B2 (en) 2018-10-18 2021-05-18 Sharp Kabushiki Kaisha Image forming apparatus, method of processing image, and recording medium storing image processing program
JP6802417B1 (ja) * 2020-09-03 2020-12-16 ファーストアカウンティング株式会社 データ処理装置、データ処理方法及びプログラム
WO2022049689A1 (ja) * 2020-09-03 2022-03-10 ファーストアカウンティング株式会社 データ処理装置、データ処理方法及びプログラム
WO2023032802A1 (ja) * 2021-09-01 2023-03-09 株式会社KPMG Ignition Tokyo アノテーション支援装置、アノテーション支援方法、アノテーション支援プログラム

Also Published As

Publication number Publication date
US8228522B2 (en) 2012-07-24
JP2010160811A (ja) 2010-07-22
US20080180717A1 (en) 2008-07-31
JP5005787B2 (ja) 2012-08-22
JP5005554B2 (ja) 2012-08-22

Similar Documents

Publication Publication Date Title
JP5005787B2 (ja) 文書データ管理装置
JP5085340B2 (ja) ワークフロー管理システム、ワークフロー管理方法
US7812986B2 (en) System and methods for use of voice mail and email in a mixed media environment
US7551780B2 (en) System and method for using individualized mixed document
US8156427B2 (en) User interface for mixed media reality
CN101178725B (zh) 用于信息检索的设备和方法
WO2007023994A1 (en) System and methods for creation and use of a mixed media environment
EP2482210A2 (en) System and methods for creation and use of a mixed media environment
US7530109B2 (en) Systems and methods for generating secure documents from scanned images
JP7087598B2 (ja) 情報処理装置、情報処理システムおよびプログラム
JP2016066334A (ja) 情報処理装置、情報処理方法、情報処理システム、プログラム
US20050018237A1 (en) Digital transmitter security
JP4811133B2 (ja) 画像形成装置及び画像処理装置
JP7379987B2 (ja) 情報処理装置及びプログラム
US11295124B2 (en) Methods and systems for automatically detecting the source of the content of a scanned document
JP4379449B2 (ja) 画像読取装置、画像読取装置の制御プログラム、および画像読取装置の制御方法
JP2007041709A (ja) 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2009182530A (ja) 業務処理遂行支援装置
JP2009199404A (ja) 情報処理システム及びプログラム
JP7298178B2 (ja) 情報処理装置および情報処理システム
JP2009070246A (ja) 情報処理システム,情報処理装置,プログラム,および記録媒体
JP6281739B2 (ja) 処理装置及びプログラム
WO2023062798A1 (ja) 情報処理システム、項目値抽出方法、モデル生成方法及びプログラム
JP2008181223A (ja) 電子文書管理システム、電子文書管理方法、プログラムおよび記録媒体
JP2020135295A (ja) 情報処理システム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100315

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100315

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100324

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100402

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120508

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120523

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150601

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees