JP2008052439A - 画像処理システムおよび画像処理プログラム - Google Patents

画像処理システムおよび画像処理プログラム Download PDF

Info

Publication number
JP2008052439A
JP2008052439A JP2006226822A JP2006226822A JP2008052439A JP 2008052439 A JP2008052439 A JP 2008052439A JP 2006226822 A JP2006226822 A JP 2006226822A JP 2006226822 A JP2006226822 A JP 2006226822A JP 2008052439 A JP2008052439 A JP 2008052439A
Authority
JP
Japan
Prior art keywords
attribute
extraction
extracted
function
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006226822A
Other languages
English (en)
Inventor
Michihiro Tamune
道弘 田宗
Kunikazu Ueno
邦和 上野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006226822A priority Critical patent/JP2008052439A/ja
Publication of JP2008052439A publication Critical patent/JP2008052439A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】入力した画像から認識した属性名の変更ができないことを課題とし、文書内の属性名の変更を可能にする画像処理システムを提供する。
【解決手段】画像処理システムの領域抽出手段は、入力した画像から領域を抽出し、文字認識手段は、前記領域抽出手段によって抽出された領域内の文字を認識し、属性抽出手段は、前記文字認識手段によって認識された結果に応じて、前記領域抽出手段によって抽出された領域の属性名を抽出し、対応属性記憶手段は、第1の属性と該第1の属性と対応している第2の属性を記憶し、属性変換手段は、前記対応属性記憶手段に記憶されている属性に応じて、前記属性抽出手段によって抽出された属性を変換する。
【選択図】図1

Description

本発明は、画像処理システムおよび画像処理プログラムに関する。
紙文書は、情報の伝達や記録を行うための媒体として優れたものであるが、これを保存するために書庫などのスペースが必要になる。また、情報を紙文書に記録して保存している場合、後にその紙文書に記録された情報が必要になったときには、書庫などに収納されている多くの紙文書の中から目的とする情報が記録された紙文書を探し出さなければならない。
そこで、紙文書を電子化して保存することが行われるようになってきている。具体的には、スキャナなどによって紙文書の各ページに対応する画像を読み取り、その画像に対応する画像データを紙文書毎にファイル化してハードディスクなどの記憶装置に記憶させることが行われるようになってきている。そして、文書画像データに対して、文字認識処理を行い、テキストコードとしての文書として取り扱えるようになっている。
一方、文書作成アプリケーション(いわゆるワープロソフトウェア等)によって作成される電子文書としては、XML(eXtensible Markup Language)等を用いて、データの意味を項目ごとに定義付け、そのデータを構造化して管理することが行われている。これらを採用することによって、会社間の取引に使うデータ項目について、業界ごとに標準化を進めている状況である。
これらに関連する技術として、例えば、特許文献1には、データ構造を定義するスキーマの生成を容易に行うことができるデータ管理システムを提供することを課題とし、スキーマのいずれかを派生元として、そのスキーマのデータ構造要素を変更して新たな派生先のスキーマを生成する工程、その派生先のスキーマと派生元のスキーマとを関連付けて保持する工程を含み、派生先のスキーマに属するデータセットを所定処理に供する際に関連付けを利用するデータ管理システムが開示されている。
特開2004−021449号公報
本発明は、このような背景技術の状況の中でなされたもので、入力した画像から文字認識して得た属性名の変更ができないことを課題とし、文書内の属性名の変更を可能にする画像処理システムおよび画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
[1] 入力した画像から領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された領域内の文字を認識する文字認識手段と、
前記文字認識手段によって認識された結果に応じて、前記領域抽出手段によって抽出された領域の属性名を抽出する属性抽出手段と、
第1の属性と該第1の属性と対応している第2の属性を記憶している対応属性記憶手段と、
前記対応属性記憶手段に記憶されている属性に応じて、前記属性抽出手段によって抽出された属性を変換する属性変換手段
を具備することを特徴とする画像処理システム。
[2] 入力した画像から領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された領域内の文字を認識する文字認識手段と、
前記文字認識手段によって認識された結果に応じて、前記領域抽出手段によって抽出された領域の属性を抽出する属性抽出手段と、
前記属性抽出手段によって抽出された属性に応じて、文書の構造を変換する構造変換手段と、
第1の属性と該第1の属性と対応している第2の属性を記憶している対応属性記憶手段と、
前記対応属性記憶手段に記憶されている属性および前記構造変換手段によって変換された構造に応じて、前記属性抽出手段によって抽出された属性を変換する属性変換手段
を具備することを特徴とする画像処理システム。
[3] 入力した画像から領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された領域内の文字を認識する文字認識手段と、
前記文字認識手段によって認識された結果に応じて、前記領域抽出手段によって抽出された領域の属性を抽出する属性抽出手段と、
前記属性抽出手段によって抽出された属性に応じて、文書の構造を変換する構造変換手段と、
第1の属性と該第1の属性と対応している第2の属性を記憶している対応属性記憶手段と、
修正前の属性と修正後の属性とを対応させて記憶している修正属性記憶手段と、
前記対応属性記憶手段に記憶されている属性、前記修正属性記憶手段に記憶されている属性、前記構造変換手段によって変換された構造、または自然言語処理による結果に応じて、前記属性抽出手段によって抽出された属性を変換する属性変換手段
を具備することを特徴とする画像処理システム。
[4] 画像を入力する画像入力手段と、
前記画像入力手段によって入力された画像から領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された領域内の文字を認識する文字認識手段と、
前記文字認識手段によって認識された結果に応じて、前記領域抽出手段によって抽出された領域の属性を抽出する属性抽出手段と、
前記属性抽出手段によって抽出された属性に応じて、文書の構造を変換する構造変換手段と、
第1の属性と該第1の属性と対応している第2の属性を記憶している対応属性記憶手段と、
修正前の属性と修正後の属性とを対応させて記憶している修正属性記憶手段と、
前記対応属性記憶手段に記憶されている属性、前記修正属性記憶手段に記憶されている属性、前記構造変換手段によって変換された構造、または自然言語処理による結果に応じて、前記属性抽出手段によって抽出された属性を変換する属性変換手段と、
前記構造変換手段によって変換された構造、前記属性変換手段によって変換された属性および前記文字認識手段による認識結果に対して、文書処理を行う文書処理手段
を具備することを特徴とする画像処理システム。
[5] コンピュータに、
入力した画像から領域を抽出する領域抽出機能と、
前記領域抽出機能によって抽出された領域内の文字を認識する文字認識機能と、
前記文字認識機能によって認識された結果に応じて、前記領域抽出機能によって抽出された領域の属性名を抽出する属性抽出機能と、
第1の属性と該第1の属性と対応している第2の属性を記憶部に記憶させるように制御する対応属性記憶制御機能と、
前記対応属性記憶制御機能によって記憶されている属性に応じて、前記属性抽出機能によって抽出された属性を変換する属性変換機能
を実現させることを特徴とする画像処理プログラム。
[6] コンピュータに、
入力した画像から領域を抽出する領域抽出機能と、
前記領域抽出機能によって抽出された領域内の文字を認識する文字認識機能と、
前記文字認識機能によって認識された結果に応じて、前記領域抽出機能によって抽出された領域の属性を抽出する属性抽出機能と、
前記属性抽出機能によって抽出された属性に応じて、文書の構造を変換する構造変換機能と、
第1の属性と該第1の属性と対応している第2の属性を記憶部に記憶させるように制御する対応属性記憶制御機能と、
前記対応属性記憶制御機能によって記憶されている属性および前記構造変換機能によって変換された構造に応じて、前記属性抽出機能によって抽出された属性を変換する属性変換機能
を実現させることを特徴とする画像処理プログラム。
[7] コンピュータに、
入力した画像から領域を抽出する領域抽出機能と、
前記領域抽出機能によって抽出された領域内の文字を認識する文字認識機能と、
前記文字認識機能によって認識された結果に応じて、前記領域抽出機能によって抽出された領域の属性を抽出する属性抽出機能と、
前記属性抽出機能によって抽出された属性に応じて、文書の構造を変換する構造変換機能と、
第1の属性と該第1の属性と対応している第2の属性を記憶部に記憶させるように制御する対応属性記憶制御機能と、
修正前の属性と修正後の属性とを対応させて記憶部に記憶させるように制御する修正属性記憶制御機能と、
前記対応属性記憶制御機能によって記憶されている属性、前記修正属性記憶制御機能によって記憶されている属性、前記構造変換機能によって変換された構造、または自然言語処理による結果に応じて、前記属性抽出機能によって抽出された属性を変換する属性変換機能
を実現させることを特徴とする画像処理プログラム。
請求項1の画像処理システムによれば、本構成を有していない場合に比較して、文書内の属性名の変更を可能にする。例えば、一方の会社で用いている文書内の属性と他方の会社で用いている文書内の属性が、名称は異なるが同一の意味を有しているような場合に、一方の会社の属性を他方の会社の属性に変換することができるようになる。
請求項2の画像処理システムによれば、本構成を有していない場合に比較して、文書内の属性名の変更を可能にする。例えば、一方の会社で用いている文書内の属性と他方の会社で用いている文書内の属性が、名称は異なるが同一の意味を有しているような場合に、一方の会社の属性を他方の会社の属性に変換することができるようになる。
請求項3の画像処理システムによれば、本構成を有していない場合に比較して、文書内の主に文字認識の誤りの修正を可能にする。例えば、一方の会社で用いている文書内の属性と他方の会社で用いている文書内の属性が、名称は異なるが同一の意味を有しているような場合に、一方の会社の属性を他方の会社の属性に変換することができるようになり、文字認識の誤りの修正をより確実に行うことができるようになる。
請求項4の画像処理システムによれば、本構成を有していない場合に比較して、文書内の属性名の変更および文字認識の誤りの修正を行ったうえで、入力した画像の文書処理を可能にする。例えば、一方の会社で用いている文書内の属性と他方の会社で用いている文書内の属性が、名称は異なるが同一の意味を有しているような場合に、一方の会社の属性を他方の会社の属性に変換することができ、文字認識の誤りの修正をより確実に行うことができるようになるうえに、入力した画像の文書処理が可能になる。
請求項5の画像処理プログラムによれば、本構成を有していない場合に比較して、文書内の属性名の変更を可能にする。例えば、一方の会社で用いている文書内の属性と他方の会社で用いている文書内の属性が、名称は異なるが同一の意味を有しているような場合に、一方の会社の属性を他方の会社の属性に変換することができるようになる。
請求項6の画像処理プログラムによれば、本構成を有していない場合に比較して、文書内の属性名の変更を可能にする。例えば、一方の会社で用いている文書内の属性と他方の会社で用いている文書内の属性が、名称は異なるが同一の意味を有しているような場合に、一方の会社の属性を他方の会社の属性に変換することができるようになる。
請求項7の画像処理プログラムによれば、本構成を有していない場合に比較して、文書内の主に文字認識の誤りの修正を可能にする。例えば、一方の会社で用いている文書内の属性と他方の会社で用いている文書内の属性が、名称は異なるが同一の意味を有しているような場合に、一方の会社の属性を他方の会社の属性に変換することができるようになり、文字認識の誤りの修正をより確実に行うことができるようになる。
以下、図面に基づき本発明の好適な一実施の形態を説明する。
各図は一実施の形態を示している。図1は、本実施の形態の概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはプログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、プログラム、システムおよび方法の説明をも兼ねている。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散または並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続を含む。
また、システムとは、複数のコンピュータ、ハードウェア、装置等がネットワーク等で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。
以下、文書として、帳票を主に例示して説明する。また、文書処理として、帳票処理(例えば請求書に対する経理処理等)を主に例示して説明する。
また、文書の構造変換として、ファイルフォーマット変換を例示して説明する。
本実施の形態は、図1に示すように、画像入力モジュール11、装置情報入力モジュール12、領域抽出モジュール13、文字認識モジュール14、属性抽出モジュール15、ファイルフォーマット変換モジュール16、修正モジュール17、対応属性記憶モジュール18、修正データ記憶モジュール19、文書処理20を有している。また、修正モジュール17内には、学習データ修正モジュール171、自然言語処理修正モジュール172、属性名対応修正モジュール173、操作者修正モジュール174を有している。
画像入力モジュール11は、図1に示すように、領域抽出モジュール13と接続されている。画像を入力し、その入力した画像を領域抽出モジュール13へ渡す。具体的には、スキャナ、カメラ等により画像を電子情報として入力するものである。また、ファックス等により通信回線を介して他のシステムから画像を入力してもよいし、画像データベースのように画像を記憶しているハードディスク等から読み込んできてもよい。ここで、入力する画像は1枚の画像であってもよいし、複数ページからなる画像であってもよい。
装置情報入力モジュール12は、図1に示すように、領域抽出モジュール13と接続されている。画像入力モジュール11が画像を入力する際に利用した機器(スキャナ等)に関する情報、例えば機器の識別子等を領域抽出モジュール13へ渡す。ただし、機器に関する情報は修正モジュール17で用いられ、領域抽出モジュール13からファイルフォーマット変換モジュール16まで、機器に関する情報を順繰りに渡していく。また、修正モジュール17と装置情報入力モジュール12が直接に機器に関する情報をやりとりしてもよいし、修正モジュール17と装置情報入力モジュール12が共通にアクセスできるメモリに記憶するようにしてもよい。
領域抽出モジュール13は、図1に示すように、画像入力モジュール11、装置情報入力モジュール12、文字認識モジュール14と接続されている。画像入力モジュール11によって入力された画像からその画像を構成している領域を抽出する。その領域抽出の結果を、文字認識モジュール14へ渡す。
領域の抽出は、画像から空白等で区切られた領域を抽出することによって行われる。この領域抽出の処理は、例えば、画像入力モジュール11による入力画像を二値化処理し、白画素の領域が一定の長さ(あるいは面積)以上あるところによって区切る。そのように区切ると、黒画素の領域(例えば、矩形)を抽出することができる。さらに、その黒画素の領域の画像としての特徴(例えば、面積、縦または横の大きさ、形状、黒画素塊の存在位置等)を抽出し、文字領域、図形領域、表領域、写真領域等の種別を判別することができる。もちろん他の既存の方法で領域を抽出してもよい。
文字認識モジュール14は、図1に示すように、領域抽出モジュール13、属性抽出モジュール15と接続されている。領域抽出モジュール13によって抽出された領域内の文字を認識し、その認識結果を属性抽出モジュール15へ渡す。文字認識モジュール14は、文字領域、表領域に対して文字認識処理を行うことによりテキストデータである文字列を生成する。ただし、この文字認識結果には、誤認識の結果等が含まれている可能性がある。また、文字認識結果についての確からしさを表す信頼度値を算出し、個々の認識結果に付加するようにしてもよい。
属性抽出モジュール15は、図1に示すように、文字認識モジュール14、ファイルフォーマット変換モジュール16と接続されている。文字認識モジュール14によって認識された結果に応じて、領域抽出モジュール13によって抽出された領域の属性を抽出する。ここでの属性とは、領域抽出モジュール13によって抽出された領域の項目名等である。具体的には、文書が納品書の場合、「納品書番号」、「納品日」、「摘要」、「単価」、「数量」、「料金」等が該当する。これらは、例えば、文字列の記載位置から類推することができる。つまり、一般的に、属性名が左にあり、それに対応する内容が右にあるので、欄が2つ並んでいる配置の場合に、その左側の欄にある文字列を属性として抽出する。または、予め属性名として登録された文字列のデータベースを検索することによって、それと一致する文字列を属性名とする等の属性名抽出の方法がある。
また、属性抽出モジュール15は、属性名の他に属性値(その属性に対応する文字列)、例えば「納品書番号」には英数字10桁等を抽出するようにしてもよい。
ファイルフォーマット変換モジュール16は、図1に示すように、属性抽出モジュール15、修正モジュール17と接続されている。属性抽出モジュール15によって抽出された属性に応じて、文書の構造であるファイルフォーマットを変換する。
つまり、画像入力モジュール11によって入力した画像から、他のアプリケーション(文書処理20)で使えるデータを抽出するためには、XML等で定義されているデータ構造としなければならない。
しかしながら、文字認識モジュール14での文字認識結果は、単なるテキストデータであり、このデータ自体に構造はない。属性抽出モジュール15によって、そのテキストデータから属性名と属性値が抽出されるが、そのままでは、他のアプリケーションに使えるデータ構造は有していない。
そこで、ファイルフォーマット変換モジュール16は、文字認識モジュール14による文字認識結果と属性抽出モジュール15による抽出した属性名をXML等で定義されているファイルフォーマットに変換する。
対応属性記憶モジュール18は、図1に示すように、修正モジュール17と接続されている。2つの会社間(A社、B社)によっては、同一の意味であるが、違う言葉を用いる場合がある。例えば、A社では「部門名」と使い、B社では「部署名」(同様に、「作成日」と「作成年月日」等)のようにである。つまり、画像入力モジュール11で入力した文書に使われている属性名を文書処理20で使われる属性名に変換する必要があるが、そのために対応属性記憶モジュール18は属性名を対にして記憶している。
修正データ記憶モジュール19は、図1に示すように、修正モジュール17と接続されている。修正モジュール17の過去の修正処理における、修正前の属性と修正後の属性を対応させて記憶している。また、装置情報入力モジュール12による機器番号をともに記憶していてもよい。
修正モジュール17は、図1に示すように、ファイルフォーマット変換モジュール16、対応属性記憶モジュール18、修正データ記憶モジュール19、文書処理20と接続されている。対応属性記憶モジュール18に記憶されている属性、修正データ記憶モジュール19に記憶されている属性、ファイルフォーマット変換モジュール16によって変換された構造、自然言語処理による結果、または操作者による修正指示に応じて、属性抽出モジュール15によって抽出された属性を変換する。その際に、学習データ修正モジュール171、自然言語処理修正モジュール172、属性名対応修正モジュール173、操作者修正モジュール174のうち、いずれか1つ以上のモジュールを用いる。
学習データ修正モジュール171は、修正データ記憶モジュール19に記憶されている過去の修正データを用いて、文字認識モジュール14、属性抽出モジュール15の結果を修正する。同種の文書であれば、過去と同じ誤りがあり、同じ修正が行われている可能性が高いからである。例えば、修正データ記憶モジュール19に、過去に「連結書」を「連絡書」と修正したことが記憶されており、今回の文字認識モジュール14、属性抽出モジュール15の処理結果に「連結書」という単語があれば、「連絡書」と修正する。また、ファイルフォーマット変換モジュール16によって変換されたファイルフォーマットと文書処理20が本来対象とするファイルフォーマットとを比較して、対応する属性名を修正するようにしてもよい。また、装置情報入力モジュール12による機器情報を用いて、例えば、同一の機器で入力された画像であるならば、その修正情報を優先して適用するようにしてもよい。
自然言語処理修正モジュール172は、文字認識モジュール14、属性抽出モジュール15による処理結果を自然言語処理によって修正する。例えば、文書処理20で処理される用語をすべて記憶しているコーパスを用いて、それ以外の用語がでてきた場合に、操作者修正モジュール174での処理の際に、操作者に注意を促すようにする。
属性名対応修正モジュール173は、対応属性記憶モジュール18を用いて、属性を例えばB社用の用語に修正する。
操作者修正モジュール174は、操作者による修正の指示に応じて、修正を行う。学習データ修正モジュール171、自然言語処理修正モジュール172、属性名対応修正モジュール173によるそれぞれの修正箇所がわかるように、色分けしてその修正箇所を表示するようにしてもよい。また、文字認識結果の信頼度値に応じて、文字の表示の形態を変化させてもよい。例えば、信頼度値が低い文字は、目立つような文字とすることである。また、学習データ修正モジュール171から属性名対応修正モジュール173までが行った修正について、その修正の確からしさである確信度に応じて、その修正箇所を表示するようにしてもよい。例えば、確信度が低い修正箇所を目立つように表示することである。
修正モジュール17は、上記の修正処理が終了した時点で、その修正前と修正後とを対にして修正データ記憶モジュール19に記憶させる。さらに、その際に、対象とした画像を入力した機器に関する情報、修正の際の確からしさを表す確信度を記憶するようにしてもよい。
文書処理20は、図1に示すように、修正モジュール17と接続されている。ファイルフォーマット変換モジュール16によって変換された構造、修正モジュール17によって変更された属性および文字認識モジュール14による認識結果に対して、文書処理を行う。例えば、前述したように、請求書に対する経理処理、会社間における発注データのやりとりに関する処理、監査に関する処理等がある。
図2を用いて、本実施の形態を実現する場合のシステム例全体を説明する。
A社210のシステムとB社220のシステムとが通信回線290によって接続されている。
A社210には、図2に示すように、スキャナ211、プリンター212、通信サーバー213とがあり、これらは互いに接続されており、外部のシステムと通信可能になっている。
B社220には、図2に示すように、スキャナ221、プリンター222、パソコン223、通信サーバー228があり、これらは互いに社内ラン229によって接続されている。パソコン223には、ディスプレイ224、キーボード225、マウス226、文書DB227が接続されている。
本実施の形態を実現する場合の典型的な例は、A社210のスキャナ211が画像入力モジュール11、装置情報入力モジュール12に該当し、B社220のパソコン223が領域抽出モジュール13〜文書処理20までの各モジュールを実行する。
A社210、B社220間の業務として、A社210がB社220に対して、文書を送付する場合を想定して説明する。
A社210の操作者はスキャナ211を用いて、文書を画像として入力する。その画像は、通信サーバー213、通信回線290を介して、B社220に送付される。
B社220は、通信サーバー228によって、A社210からの画像を受け取る。その画像は、社内ラン229を介して、パソコン223に渡される。パソコン223では、領域抽出モジュール13から修正モジュール17までの処理が行われる。そして、学習データ修正モジュール171等による処理結果をディスプレイ224に表示し、キーボード225、マウス226を用いた操作者の操作によって操作者修正モジュール174による処理を実行する。そして、操作者の修正が完了した後に文書処理20による処理を実行し、その処理結果を文書DB227に記憶する。
また、本実施の形態は、B社220内の機器でのみ実現することもできるし、スキャナ211またはスキャナ221内で、領域抽出モジュール13〜文書処理20までの各モジュールを実行することもできる。
図3を用いて、本実施の結果が取り扱うデータ構造の例を説明する。
領域テーブル30は、図3に示すように、ID欄31、左上座標欄32、右下座標欄33、種別欄34、属性名欄35、属性値欄36、修正情報欄37の欄がある。
ID欄31から種別欄34までは、領域抽出モジュール13による処理結果が記憶され、属性名欄35と属性値欄36は、文字認識モジュール14と属性抽出モジュール15による処理結果が記憶され、修正情報欄37は、修正モジュール17による処理結果が記憶される。
ID欄31には、その画像内で抽出された領域を一意に特定できる符号が記憶される。
左上座標欄32、右下座標欄33には、領域抽出モジュール13によって抽出された領域の画像内における位置が記憶される。例えば、抽出領域が矩形の場合、画像の縦をX軸、横をY軸とした平面空間とし、その画像内における抽出領域の左上角の座標を左上座標欄32に記憶し、右下角の座標を右下座標欄33に記憶することによって、画像内における抽出領域の位置を特定できる。
種別欄34には、その部品画像の種別(文字領域、図形領域、表領域、写真領域等)が記憶される。文字領域が、文字認識モジュール14以降の処理対象となる。
属性名欄35には、左上座標欄32と右下座標欄33によって特定できる領域内に対して、文字認識モジュール14による文字認識結果の中から属性抽出モジュール15によって抽出された属性名が記憶される。
属性値欄36には、属性名欄35に記憶されている属性名に対応する属性値が記憶される。
修正情報欄37には、修正モジュール17によって修正されたか否かを示す符号が記憶される。また、どのような修正が、どのモジュールで行われたのか等の情報を含んでいてもよい。
図4を用いて、修正情報を蓄積した学習データにおけるデータ構造の例を説明する。
修正テーブル40は、図4に示すように、ID欄41、修正前欄42、修正後欄43、機器情報欄44、確信度欄45の欄がある。それぞれの欄は、修正モジュール17による処理結果が記憶される。学習データ修正モジュール171によりアクセスされるデータである。学習データ修正モジュール171を基にして、修正すべき属性を探索し、その属性を修正する。
ID欄41には、その修正を一意に特定できる符号が記憶される。
修正前欄42には、修正前の属性名が記憶される。
修正後欄43には、修正後の属性名が記憶される。
機器情報欄44には、その修正対象の画像を入力した機器に関する情報が記憶される。
確信度欄45には、修正の確からしさを表す確信度が記憶される。例えば、自然言語処理修正モジュール172による修正の際、その他の修正案があったが、その修正とした場合等には低い値となる。また、操作者による修正の場合は、高い値とする。
図5を用いて、属性名の対応関係を示すデータ構造の例を説明する。
対応属性テーブル50は、図5に示すように、ID欄51、A社属性名欄52、B社属性名欄53の欄がある。対応属性テーブル50は、予め作成されているものであり、属性名対応修正モジュール173によりアクセスされるデータである。属性名対応修正モジュール173は、対応属性テーブル50を基にして、属性の置換を行う。対応属性テーブル50に、記憶される内容は、例えば、A社210とB社220とで、同一の意味を有するが違う言葉で表されているものを対にしたものである。
ID欄51には、その対応を一意に特定できる符号が記憶される。
A社属性名欄52には、A社210で用いられている属性名が記憶される。例えば、「作成日」である。
B社属性名欄53には、A社属性名欄52に対応するB社220で用いられている属性名が記憶される。例えば、「作成日」に対応して「作成年月日」が記憶される。
図6を用いて、本実施の形態が行う処理を経時的に説明する。
ステップS601では、画像入力モジュール11が対象となる文書を画像として入力する。
ステップS602では、ステップS601で入力された画像に対して、領域抽出モジュール13が領域を抽出する。
ステップS603では、ステップS602で抽出された文字領域に対して、文字認識モジュール14が文字認識処理を行う。
ステップS604では、ステップS603で文字認識された結果に対して、属性抽出モジュール15が属性を抽出する。その際、領域抽出モジュール13による領域抽出の結果である領域の位置等の情報を用いてもよい。
ステップS605では、ステップS603で文字認識された結果とステップS604で抽出された属性とを用いて、ファイルフォーマット変換モジュール16がファイルフォーマット変換を行う。
ステップS606では、ステップS603で文字認識された結果とステップS604で抽出された属性とに対して、修正データ記憶モジュール19を用いて、学習データ修正モジュール171が修正を行う。
ステップS607では、ステップS606で修正された結果に対して、自然言語処理修正モジュール172が自然言語処理を用いた修正を行う。
ステップS608では、さらに、対応属性記憶モジュール18を用いて、属性名対応修正モジュール173が修正を行う。
ステップS609では、ステップS606からステップS608による修正結果を操作者に対して提示し、操作者による修正指示に基づいて、操作者修正モジュール174による修正が行われる。
ステップS610では、ステップS606からステップS609による修正結果を、修正モジュール17は、修正データ記憶モジュール19に反映させる。
ステップS611では、修正モジュール17によって修正された結果に対して、文書処理20による帳票処理を行う。
図7を参照して、本実施の形態の画像処理システムのハードウェア構成例について説明する。図7に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成される画像処理システムであり、スキャナ等のデータ読み取り部417と、プリンタなどのデータ出力部418を備えたハード構成例を示している。
CPU(Central Processing Unit)401は、上述の実施の形態において説明した各種のモジュール、すなわち、領域抽出モジュール13、文字認識モジュール14、属性抽出モジュール15等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムに従った処理を実行する制御部である。
ROM(Read Only Memory)402は、CPU401が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)403は、CPU401の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス404により相互に接続されている。
ホストバス404は、ブリッジ405を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス406に接続されている。
キーボード408、マウス等のポインティングデバイス409は、操作者により操作される入力デバイスである。ディスプレイ410は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)411は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU401によって実行するプログラムや情報を記録または再生させる。ハードディスクは、画像入力モジュール11により入力された画像や修正モジュール17による処理結果のデータなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ412は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体413に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース407、外部バス406、ブリッジ405、およびホストバス404を介して接続されているRAM403に供給する。リムーバブル記録媒体413も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート414は、外部接続機器415を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート414は、インタフェース407、および外部バス406、ブリッジ405、ホストバス404等を介してCPU401等に接続されている。通信部416は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部417は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部418は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図7に示す画像処理システムのハードウェア構成は、1つの構成例を示すものであり、本実施の形態の画像処理システムは、図7に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えばASIC等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図7に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(多機能複写機とも呼ばれ、スキャナ、プリンタ、複写機、ファックス等の機能を有している)などに組み込まれていてもよい。
前記実施の形態では、文書として、帳票を主に例示して説明したが、これに限ることなく、文書としての形態を有する情報群であれば対応することができる。また、同様に、文書処理としても、帳票処理に限ることなく、文書としての情報群を対象とした情報処理、例えば翻訳処理等であってもよい。
また、文書の構造変換として、ファイルフォーマット変換を例示して説明したが、これに限ることなく、文書を構成する構造を他の構造に変換して他のアプリケーション等に利用可能とするような変換処理であればよい。
なお、修正モジュール17内の処理の順番は学習データ修正モジュール171、自然言語処理修正モジュール172、属性名対応修正モジュール173、操作者修正モジュール174としたが、属性名対応修正モジュール173から先に行うようにしてもよい。
また、ファイルフォーマット変換モジュール16は、文書処理20が必要としている属性を、属性抽出モジュール15が抽出できなかった旨を修正モジュール17に渡してもよい。そして、学習データ修正モジュール171等による修正によっても属性が不足している場合には、操作者修正モジュール174は、操作者に属性が不足している旨を提示するようにしてもよい。
なお、説明したプログラムについては、記録媒体に格納することも可能であり、また、そのプログラムを通信手段によって提供することもできる。その場合、例えば、上記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えることもできる。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去および書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、上記のプログラムまたはその一部は、上記記録媒体に記録して保存や流通等させることが可能である。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにはこれらの組合せ等の伝送媒体を用いて伝送することが可能であり、また、搬送波に乗せて搬送することも可能である。
さらに、上記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。
本実施の形態の概念的なモジュール構成図である。 本実施の形態を実現する場合のシステム例全体の構成図である。 本実施の形態が取り扱うデータ構造の例である。 修正情報を蓄積した学習データにおけるデータ構造の例である。 属性名の対応関係を示すデータ構造の例である。 本実施の形態による処理を示すフローチャート例である。 本実施の形態のハードウェア構成例を示すブロック図である。
符号の説明
11…画像入力モジュール
12…装置情報入力モジュール
13…領域抽出モジュール
14…文字認識モジュール
15…属性抽出モジュール
16…ファイルフォーマット変換モジュール
17…修正モジュール
18…対応属性記憶モジュール
19…修正データ記憶モジュール
20…文書処理
30…領域テーブル
40…修正テーブル
50…対応属性テーブル
171…学習データ修正モジュール
172…自然言語処理修正モジュール
173…属性名対応修正モジュール
174…操作者修正モジュール

Claims (7)

  1. 入力した画像から領域を抽出する領域抽出手段と、
    前記領域抽出手段によって抽出された領域内の文字を認識する文字認識手段と、
    前記文字認識手段によって認識された結果に応じて、前記領域抽出手段によって抽出された領域の属性名を抽出する属性抽出手段と、
    第1の属性と該第1の属性と対応している第2の属性を記憶している対応属性記憶手段と、
    前記対応属性記憶手段に記憶されている属性に応じて、前記属性抽出手段によって抽出された属性を変換する属性変換手段
    を具備することを特徴とする画像処理システム。
  2. 入力した画像から領域を抽出する領域抽出手段と、
    前記領域抽出手段によって抽出された領域内の文字を認識する文字認識手段と、
    前記文字認識手段によって認識された結果に応じて、前記領域抽出手段によって抽出された領域の属性を抽出する属性抽出手段と、
    前記属性抽出手段によって抽出された属性に応じて、文書の構造を変換する構造変換手段と、
    第1の属性と該第1の属性と対応している第2の属性を記憶している対応属性記憶手段と、
    前記対応属性記憶手段に記憶されている属性および前記構造変換手段によって変換された構造に応じて、前記属性抽出手段によって抽出された属性を変換する属性変換手段
    を具備することを特徴とする画像処理システム。
  3. 入力した画像から領域を抽出する領域抽出手段と、
    前記領域抽出手段によって抽出された領域内の文字を認識する文字認識手段と、
    前記文字認識手段によって認識された結果に応じて、前記領域抽出手段によって抽出された領域の属性を抽出する属性抽出手段と、
    前記属性抽出手段によって抽出された属性に応じて、文書の構造を変換する構造変換手段と、
    第1の属性と該第1の属性と対応している第2の属性を記憶している対応属性記憶手段と、
    修正前の属性と修正後の属性とを対応させて記憶している修正属性記憶手段と、
    前記対応属性記憶手段に記憶されている属性、前記修正属性記憶手段に記憶されている属性、前記構造変換手段によって変換された構造、または自然言語処理による結果に応じて、前記属性抽出手段によって抽出された属性を変換する属性変換手段
    を具備することを特徴とする画像処理システム。
  4. 画像を入力する画像入力手段と、
    前記画像入力手段によって入力された画像から領域を抽出する領域抽出手段と、
    前記領域抽出手段によって抽出された領域内の文字を認識する文字認識手段と、
    前記文字認識手段によって認識された結果に応じて、前記領域抽出手段によって抽出された領域の属性を抽出する属性抽出手段と、
    前記属性抽出手段によって抽出された属性に応じて、文書の構造を変換する構造変換手段と、
    第1の属性と該第1の属性と対応している第2の属性を記憶している対応属性記憶手段と、
    修正前の属性と修正後の属性とを対応させて記憶している修正属性記憶手段と、
    前記対応属性記憶手段に記憶されている属性、前記修正属性記憶手段に記憶されている属性、前記構造変換手段によって変換された構造、または自然言語処理による結果に応じて、前記属性抽出手段によって抽出された属性を変換する属性変換手段と、
    前記構造変換手段によって変換された構造、前記属性変換手段によって変換された属性および前記文字認識手段による認識結果に対して、文書処理を行う文書処理手段
    を具備することを特徴とする画像処理システム。
  5. コンピュータに、
    入力した画像から領域を抽出する領域抽出機能と、
    前記領域抽出機能によって抽出された領域内の文字を認識する文字認識機能と、
    前記文字認識機能によって認識された結果に応じて、前記領域抽出機能によって抽出された領域の属性名を抽出する属性抽出機能と、
    第1の属性と該第1の属性と対応している第2の属性を記憶部に記憶させるように制御する対応属性記憶制御機能と、
    前記対応属性記憶制御機能によって記憶されている属性に応じて、前記属性抽出機能によって抽出された属性を変換する属性変換機能
    を実現させることを特徴とする画像処理プログラム。
  6. コンピュータに、
    入力した画像から領域を抽出する領域抽出機能と、
    前記領域抽出機能によって抽出された領域内の文字を認識する文字認識機能と、
    前記文字認識機能によって認識された結果に応じて、前記領域抽出機能によって抽出された領域の属性を抽出する属性抽出機能と、
    前記属性抽出機能によって抽出された属性に応じて、文書の構造を変換する構造変換機能と、
    第1の属性と該第1の属性と対応している第2の属性を記憶部に記憶させるように制御する対応属性記憶制御機能と、
    前記対応属性記憶制御機能によって記憶されている属性および前記構造変換機能によって変換された構造に応じて、前記属性抽出機能によって抽出された属性を変換する属性変換機能
    を実現させることを特徴とする画像処理プログラム。
  7. コンピュータに、
    入力した画像から領域を抽出する領域抽出機能と、
    前記領域抽出機能によって抽出された領域内の文字を認識する文字認識機能と、
    前記文字認識機能によって認識された結果に応じて、前記領域抽出機能によって抽出された領域の属性を抽出する属性抽出機能と、
    前記属性抽出機能によって抽出された属性に応じて、文書の構造を変換する構造変換機能と、
    第1の属性と該第1の属性と対応している第2の属性を記憶部に記憶させるように制御する対応属性記憶制御機能と、
    修正前の属性と修正後の属性とを対応させて記憶部に記憶させるように制御する修正属性記憶制御機能と、
    前記対応属性記憶制御機能によって記憶されている属性、前記修正属性記憶制御機能によって記憶されている属性、前記構造変換機能によって変換された構造、または自然言語処理による結果に応じて、前記属性抽出機能によって抽出された属性を変換する属性変換機能
    を実現させることを特徴とする画像処理プログラム。
JP2006226822A 2006-08-23 2006-08-23 画像処理システムおよび画像処理プログラム Pending JP2008052439A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006226822A JP2008052439A (ja) 2006-08-23 2006-08-23 画像処理システムおよび画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006226822A JP2008052439A (ja) 2006-08-23 2006-08-23 画像処理システムおよび画像処理プログラム

Publications (1)

Publication Number Publication Date
JP2008052439A true JP2008052439A (ja) 2008-03-06

Family

ID=39236446

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006226822A Pending JP2008052439A (ja) 2006-08-23 2006-08-23 画像処理システムおよび画像処理プログラム

Country Status (1)

Country Link
JP (1) JP2008052439A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2008221525B2 (en) * 2008-03-14 2010-04-22 Fuji Xerox Co., Ltd. Information processor, information processing method, and information processing program
JP2012248043A (ja) * 2011-05-30 2012-12-13 Dainippon Printing Co Ltd コンテンツ生成装置、コンテンツ生成方法、およびプログラム
JP2020166658A (ja) * 2019-03-29 2020-10-08 大日本印刷株式会社 情報処理装置、情報処理方法及びプログラム
JP2020194391A (ja) * 2019-05-29 2020-12-03 株式会社日立製作所 情報管理方法、情報管理システムおよび情報管理プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05346970A (ja) * 1991-04-04 1993-12-27 Fuji Xerox Co Ltd 文書認識装置
JP2000123116A (ja) * 1998-10-15 2000-04-28 Ricoh Co Ltd 文字認識結果修正方法
JP2002099451A (ja) * 2000-09-26 2002-04-05 Kawaju Techno Service Corp データ連携システム及びデータ連携方法
JP2004145736A (ja) * 2002-10-25 2004-05-20 Canon Software Inc 文字認識装置および文字認識データ出力方法およびプログラムおよび記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05346970A (ja) * 1991-04-04 1993-12-27 Fuji Xerox Co Ltd 文書認識装置
JP2000123116A (ja) * 1998-10-15 2000-04-28 Ricoh Co Ltd 文字認識結果修正方法
JP2002099451A (ja) * 2000-09-26 2002-04-05 Kawaju Techno Service Corp データ連携システム及びデータ連携方法
JP2004145736A (ja) * 2002-10-25 2004-05-20 Canon Software Inc 文字認識装置および文字認識データ出力方法およびプログラムおよび記録媒体

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2008221525B2 (en) * 2008-03-14 2010-04-22 Fuji Xerox Co., Ltd. Information processor, information processing method, and information processing program
JP2012248043A (ja) * 2011-05-30 2012-12-13 Dainippon Printing Co Ltd コンテンツ生成装置、コンテンツ生成方法、およびプログラム
JP2020166658A (ja) * 2019-03-29 2020-10-08 大日本印刷株式会社 情報処理装置、情報処理方法及びプログラム
JP7322468B2 (ja) 2019-03-29 2023-08-08 大日本印刷株式会社 情報処理装置、情報処理方法及びプログラム
JP2020194391A (ja) * 2019-05-29 2020-12-03 株式会社日立製作所 情報管理方法、情報管理システムおよび情報管理プログラム
WO2020241013A1 (ja) * 2019-05-29 2020-12-03 株式会社日立製作所 情報管理方法、情報管理システムおよび情報管理プログラム
JP7458151B2 (ja) 2019-05-29 2024-03-29 株式会社日立製作所 情報管理方法、情報管理システムおよび情報管理プログラム

Similar Documents

Publication Publication Date Title
US20160350270A1 (en) Information processing apparatus and method and non-transitory computer readable medium
US11182604B1 (en) Computerized recognition and extraction of tables in digitized documents
CN107766009A (zh) 信息处理装置和信息处理方法
JP5321109B2 (ja) 情報処理装置及び情報処理プログラム
JP2008052439A (ja) 画像処理システムおよび画像処理プログラム
JP2008054147A (ja) 画像処理装置および画像処理プログラム
JP6221220B2 (ja) 画像処理装置及び画像処理プログラム
US20100023517A1 (en) Method and system for extracting data-points from a data file
JP5481965B2 (ja) 情報処理装置及び情報処理プログラム
JP5440043B2 (ja) 画像処理装置及び画像処理プログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP5510221B2 (ja) 情報処理装置及び情報処理プログラム
JP5194851B2 (ja) 情報処理装置及び情報処理プログラム
US9661179B2 (en) Image processing device, information processing method, and non-transitory computer-readable medium
JP6421568B2 (ja) 情報処理装置及び情報処理プログラム
JP2012098852A (ja) 画像処理装置及び画像処理プログラム
JP5476884B2 (ja) 画像処理装置及び画像処理プログラム
JP5445740B2 (ja) 画像処理装置、画像処理システムおよび処理プログラム
JP4535176B2 (ja) 作業制御プログラム及び作業制御システム
US11410441B2 (en) Information processing apparatus and non-transitory computer readable medium
US11206336B2 (en) Information processing apparatus, method, and non-transitory computer readable medium
JP2008108153A (ja) 情報処理システムおよび情報処理プログラム
JP5928714B2 (ja) 情報処理装置及び情報処理プログラム
JP2008084186A (ja) 画像処理システム及び画像処理プログラム
JP6003677B2 (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110726

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110819

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120313