JP2008059255A - 情報入力装置、及びプログラム - Google Patents

情報入力装置、及びプログラム Download PDF

Info

Publication number
JP2008059255A
JP2008059255A JP2006235108A JP2006235108A JP2008059255A JP 2008059255 A JP2008059255 A JP 2008059255A JP 2006235108 A JP2006235108 A JP 2006235108A JP 2006235108 A JP2006235108 A JP 2006235108A JP 2008059255 A JP2008059255 A JP 2008059255A
Authority
JP
Japan
Prior art keywords
information
type
image
information input
input device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006235108A
Other languages
English (en)
Inventor
Yasushi Sakata
靖 坂田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006235108A priority Critical patent/JP2008059255A/ja
Publication of JP2008059255A publication Critical patent/JP2008059255A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】 様々な様式で情報が表示された画像表示媒体から、特定の情報を読み取ることができる情報入力装置を提供する。
【解決手段】 情報入力装置2は、背景色と情報の種類とが互いに対応付けられた種類テーブルを予め有し、画像表示媒体から読み取られた画像に対して、文字認識処理を行い、画像中で特定された文字列について、上記種類テーブルを用いて、文字列で示される情報の種類を判定し、判定結果に応じて、特定された文字列を分類整理する。
【選択図】図4

Description

本発明は、情報入力装置に関する。
例えば、特許文献1には、原稿上の太線又はマ−カペンにより指定された枠を検知することで文字認識対象領域を設定する複写装置が開示されている。
また、特許文献2には、多数枚の伝票を読み取って累積演算する光学式文字認識装置において、読み取られた帳票が白紙の場合には累積演算結果をホスト・コンピュータに転送する光学式文字読取装置が開示されている。
また、特許文献3には、端末側の読み取り手段から任意のフォーマットの帳票を読み取り、表示手段に表示された帳票の画像情報を参照して、このフォーマットをデータ化し、データ化されたフォーマットを本体側に登録する帳票用文字認識装置が開示されている。
特開平7−273928号公報 特開平5−342401号公報 特開平10−97587号公報
本発明は、上述した背景からなされたものであり、様々な様式で情報が表示された画像表示媒体から、特定の情報を読み取ることができる情報入力装置を提供することを目的とする。
[情報入力装置]
上記目的を達成するために、本発明にかかる情報入力装置は、画像を読み取る読取手段と、前記読取手段により読み取られた画像の中から、既定の描画特性を有する画像領域を特定する領域特定手段と、前記領域特定手段により特定された画像領域に表示された情報の種類を、この画像領域の描画特性に基づいて判定する種類判定手段とを有する。
好適には、前記描画特性は、色又は模様であり、前記領域特定手段は、既定の色又は模様が背景となっている画像領域を特定し、前記種類判定手段は、特定された画像領域における背景の色又は模様に基づいて、情報の種類を判定する。
好適には、前記領域特定手段により特定された画像領域に対して、文字認識処理を行う文字認識手段をさらに有し、前記種類判定手段は、前記文字認識手段により認識された文字列が示す情報の種類を判定する。
好適には、情報の種類と描画特性とが互いに対応付けられた種類テーブルを登録するテーブル登録手段と、前記種類判定手段は、前記テーブル登録手段により登録された種類テーブルを参照して、画像領域に表示された情報の種類を判定する。
[プログラム]
また、本発明にかかるプログラムは、画像表示媒体から読み取られた画像の中から、既定の描画特性を有する画像領域を特定するステップと、特定された画像領域に表示された情報の種類を、この画像領域の描画特性に基づいて判定するステップとをコンピュータに実行させる。
請求項1にかかる発明は、様々な様式の画像表示媒体に表示された情報の種類を特定することができる。
請求項2にかかる発明は、ユーザにとって特定の情報を記載すべき領域を判別しやすくなり、また、特定の情報が記載される領域の範囲を判別しやすくなる。
請求項3にかかる発明は、画像表示媒体から読み取られた画像から、特定の種類の情報を取り出すことができる。
請求項4にかかる発明は、ユーザが任意に特定の情報を記載すべき領域の描画特性を決定することができる。
請求項5にかかる発明は、様々な様式の画像表示媒体に表示された情報の種類を特定することができる。
[ハードウェア構成]
まず、情報入力装置2のハードウェア構成を説明する。
図1は、情報入力装置2のハードウェア構成を、制御装置20を中心に例示する図である。
図1に例示するように、情報入力装置2は、CPU202及びメモリ204などを含む制御装置20、通信装置22、スキャナ装置23、HDD・CD装置などの記録装置24、並びに、LCD表示装置あるいはCRT表示装置およびキーボード・タッチパネルなどを含むユーザインターフェース装置(UI装置)26から構成される。
情報入力装置2は、例えば、スキャナ装置23により光学的に読み取られた画像データから、特定の情報を抽出し、抽出された情報を仕分けしてサーバ(不図示)に送信する。
なお、情報入力装置2は、スキャナ装置23に加えて、印刷機能及びファクシミリ送受信機能を実現する装置を有してもよい。
[情報入力プログラム]
図2は、制御装置20(図1)により実行される情報入力プログラム5の機能構成を例示する図である。
図2に例示するように、情報入力プログラム5は、画像読取部500、文字認識部510、背景判定部520、テーブル登録部530、種類判定部540、及び情報送信部550を有する。
情報入力プログラム5は、例えば、記録媒体240に記録されており、この記録媒体240を介して制御装置20にインストールされる。
情報入力プログラム5において、画像読取部500は、スキャナ装置23(図1)を制御して、画像表示媒体(例えば、伝票)から画像を読み取り、読み取られた画像のデータを文字認識部510及び背景判定部520に出力する。
文字認識部510は、画像読取部500により読み取られた画像データに対して、文字認識処理を行い、画像に含まれる文字を特定し、特定された文字を種類判定部540に出力する。
例えば、文字認識部510は、パターンマッチングなどにより、画像に含まれる文字列(数字、かな、漢字、アルファベット、記号等)を特定し、特定された文字列の文字コードを種類判定部540に出力する。
背景判定部520は、画像読取部500により読み取られた画像データの中から、特定の描画特性を有する画像領域を特定し、特定された画像領域の範囲及びその描画特性を種類判定部540に通知する。ここで、「描画特性」とは、例えば、色、又は、模様などである。そして、この場合の「色」には、人間の目に見える色の他、人間の目に見えない波長領域の反射光(紫外光、赤外光など)も含まれうる。
本例の背景判定部520は、画像読取部500により読み取られた画像データの中から、テーブル登録部530に登録された色が背景となっている画像領域を特定する。
テーブル登録部530は、UI装置26(図1)又は通信装置22(図1)を介して、描画特性(例えば、背景の色又は模様)と、情報の種類(例えば、商品名、単価、数量、合計額など)とを互いに対応付ける種類テーブルの登録を受け付ける。
例えば、ユーザが、ネットワークに接続されたコンピュータ端末、又は、UI装置26などを操作して、情報の種類に対応する描画特性を指定すると、テーブル登録部530は、ユーザの指定に応じて、描画特性と情報の種類とが互いに対応付けられた種類テーブルを生成し、生成された種類テーブルを登録する。
種類判定部540は、文字認識部510により特定された文字又は文字列が示す情報の種類を判定する。
本例の種類判定部540は、文字認識部510により特定された文字列が、背景判定部520により特定された画像領域のいずれに存在するかを判断し、この文字が存在する画像領域の描画特性に対応する情報の種類を、テーブル登録部530に登録されている種類テーブルから読み出し、読み出された種類とその文字のコードとを情報送信部550に出力する。なお、同一の画像領域に複数の文字列が存在する場合に、種類判定部540は、それぞれの文字列について、情報の種類を判定し、それぞれの文字列のコードに対して、情報の種類を対応付けて情報送信部550に出力する。
情報送信部550は、種類判定部540により判定された情報の種類に基づいて、文字認識部510により特定された文字(又は文字列)を分類する。
本例の情報送信部550は、種類判定部540から入力された情報の種類に基づいて、種類判定部540から入力された文字コードを分類して、表計算ソフトウェアのデータフォーマットに変換し、この文字コードが含まれたデータファイルを外部に送信する。
図3は、テーブル登録部530(図2)により登録される種類テーブル532を例示する図である。
図3に例示するように、本例のテーブル登録部530は、ユーザの操作に応じて、背景の色と情報の種類及び属性とが互いに対応付けられた種類テーブル532を作成し、作成された種類テーブル532を登録する。情報の属性とは、情報が有する性質であり、例えば、かな、漢字、数字又はアルファベットなどの文字種や、文字数又は数字の桁数などの文字列の長さなどである。情報の属性は、例えば、文字認識処理の精度向上を図るため、又は、同一の画像領域に記載された複数の文字列を分離するためなどに利用される。
なお、本図では、「黄色」、「グレー」、「青色」等と記載されているが、実際には、各色に相当する各色成分の範囲(例えば、R成分、G成分及びB成分の範囲)が、種類テーブル532に登録される。
図4は、スキャナ装置23(図1)で読み取られる画像表示媒体(伝票700)を例示する図である。
図4に例示するように、伝票700には、複数の記載欄710が設けられている。各記載欄710は、単一の色で塗り潰されている。各記載欄710の色は、記載されるべき情報の種類に応じて決定された色であり、種類テーブル532に登録される色である。したがって、記載されるべき情報の種類が異なると、記載欄710の背景色も異なる。
ユーザは、この伝票700に、手書きで「商品名」、「単価」、「数量」等を記載して、この伝票700の記載面を情報入力装置2のスキャナ装置23で読み取らせる。
図5は、第2の伝票702を例示する図である。
図5に例示された伝票702は、図4の伝票700のレイアウトを変更したものである。このように、伝票のレイアウトを変更しても、各記載欄710の色が一致していれば、情報入力装置2により文字列の抽出及び分類が可能である。
[全体動作]
次に、情報入力装置2の動作を説明する。
図6は、情報入力プログラム5の動作(S10)を示すフローチャートである。
図6に示すように、ステップ100(S100)において、ユーザは、図4又は図5に例示した伝票700(702)の記載欄710に手書きで情報を記載し、情報入力装置2のスキャナ装置23(図1)にセットし、情報読取りを指示する。
情報入力プログラム5の画像読取部500(図2)は、ユーザの指示に応じて、スキャナ装置23を制御して、伝票700(702)から画像を読み取らせ、読み取られた画像データを文字認識部510及び背景判定部520に出力する。
ステップ110(S110)において、文字認識部510は、画像読取部500から入力された画像データに対して、文字認識処理を行い、画像に含まれる文字を特定し、特定された文字のコードを種類判定部540に出力し、文字が特定された位置を背景判定部520に出力する。
ステップ120(S120)において、背景判定部520は、文字認識部510から入力された位置(文字が特定された位置)の背景色(下地色)を判定し、判定された色を種類判定部540に出力する。背景色は、例えば、既定の誤差範囲内の画素値(RGB値)が既定サイズ以上連続するか否かにより判定される。
ステップ130(S130)において、種類判定部540は、文字認識部510から入力された文字コードについて、背景判定部520により判定された背景色に基づいて、情報の種類を判定し、文字コードとその判定結果とを情報送信部550に出力する。情報の種類の判定は、背景判定部520により判定された背景色に対応する情報の種類を種類テーブル532(図3)から読み出すことにより実現される。
ステップ140(S140)において、情報送信部550は、種類判定部540から入力された判定結果(情報の種類)に応じて、種類判定部540から入力された文字コードを分類し、表計算ソフトウェアのデータフォーマットで整理する。
ステップ150(S150)において、情報送信部550は、表計算ソフトウェアのデータフォーマットで整理された文字コードを外部(例えば、情報の集計を行う本部サーバなど)に送信する。
以上説明したように、本実施形態における情報入力装置2は、記載欄の背景色又は背景模様に基づいて、記載欄に記載された情報の種類を判別し、情報の種類に応じて、記載されていた情報を整理する。
[変形例]
上記実施形態では、まず文字認識処理を行い、文字が特定された領域の背景色を判定しているが、これに限定されるものではない。
そこで、本変形例の情報入力装置2は、特定の色(又は模様)が背景となっている画像領域を特定し、特定された画像領域についてのみ、文字認識処理を行う。
図7は、変形例における情報入力プログラム5の動作(S20)を示すフローチャートである。
図7に示すように、ステップ200(S200)において、ユーザは、伝票700(図4)の記載欄710に手書きで情報を記載し、情報入力装置2のスキャナ装置23(図1)にセットし、情報読取りを指示する。
情報入力プログラム5の画像読取部500(図2)は、ユーザの指示に応じて、スキャナ装置23を制御して、伝票700(702)から画像を読み取らせ、読み取られた画像データを文字認識部510及び背景判定部520に出力する。
ステップ210(S210)において、背景判定部520は、テーブル登録部530の種類テーブル532(図3)に登録された色が背景色として用いられている画像領域を特定し、特定された画像領域の範囲を文字認識部510に通知し、特定された画像領域の背景色を種類判定部540に通知する。
ステップ220(S220)において、情報入力プログラム5は、背景判定部520により特定された画像領域の中から、順に注目領域を設定する。
ステップ230(S230)において、種類判定部540は、背景判定部520により判定された注目領域の背景色に基づいて、情報の種類及び属性を判定し、判定された属性を文字認識部510に出力する。
ステップ240(S240)において、文字認識部510は、画像読取部500から入力された画像データのうち、背景判定部520から通知された注目領域(画像領域)の範囲に対して文字認識処理を行う。この場合の文字認識処理は、種類判定部540から通知された属性(例えば、文字の種類など)に応じた処理である。
文字認識部510は、注目領域で特定された文字列の文字コードを種類判定部540に出力し、種類判定部540は、文字認識部510から入力された文字コードに対して、この注目領域で判定された情報の種類を対応付けて情報送信部550に出力する。
ステップ250(S250)において、情報送信部550は、種類判定部540から入力された情報の種類に応じて、種類判定部540から入力された文字コードを分類し、表計算ソフトウェアのデータフォーマットで整理する。
ステップ260(S260)において、情報入力プログラム5は、全画像領域について処理が終了したか否かを判断し、未処理の画像領域が存在する場合には、S220の処理に戻り、全画像領域について処理が終了した場合には、S270の処理に移行する。
ステップ270(S270)において、情報送信部550は、表計算ソフトウェアのデータフォーマットで整理された文字コードを外部(例えば、情報の集計を行う本部サーバなど)に送信する。
情報入力装置2のハードウェア構成を、制御装置20を中心に例示する図である。 制御装置20(図1)により実行される情報入力プログラム5の機能構成を例示する図である。 テーブル登録部530(図2)により登録される種類テーブル532を例示する図である。 スキャナ装置23(図1)で読み取られる画像表示媒体(伝票700)を例示する図である。 第2の伝票702を例示する図である。 情報入力プログラム5の動作(S10)を示すフローチャートである。 変形例における情報入力プログラム5の動作(S20)を示すフローチャートである。
符号の説明
2・・・情報入力装置
5・・・情報入力プログラム
500・・・画像読取部
510・・・文字認識部
520・・・背景判定部
530・・・テーブル登録部
540・・・種類判定部
550・・・情報送信部

Claims (5)

  1. 画像を読み取る読取手段と、
    前記読取手段により読み取られた画像の中から、既定の描画特性を有する画像領域を特定する領域特定手段と、
    前記領域特定手段により特定された画像領域に表示された情報の種類を、この画像領域の描画特性に基づいて判定する種類判定手段と
    を有する情報入力装置。
  2. 前記描画特性は、色又は模様であり、
    前記領域特定手段は、既定の色又は模様が背景となっている画像領域を特定し、
    前記種類判定手段は、特定された画像領域における背景の色又は模様に基づいて、情報の種類を判定する
    請求項1に記載の情報入力装置。
  3. 前記領域特定手段により特定された画像領域に対して、文字認識処理を行う文字認識手段
    をさらに有し、
    前記種類判定手段は、前記文字認識手段により認識された文字列が示す情報の種類を判定する
    請求項1に記載の情報入力装置。
  4. 情報の種類と描画特性とが互いに対応付けられた種類テーブルを登録するテーブル登録手段と、
    前記種類判定手段は、前記テーブル登録手段により登録された種類テーブルを参照して、画像領域に表示された情報の種類を判定する
    請求項1に記載の情報入力装置。
  5. 画像表示媒体から読み取られた画像の中から、既定の描画特性を有する画像領域を特定するステップと、
    特定された画像領域に表示された情報の種類を、この画像領域の描画特性に基づいて判定するステップと
    をコンピュータに実行させるプログラム。
JP2006235108A 2006-08-31 2006-08-31 情報入力装置、及びプログラム Pending JP2008059255A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006235108A JP2008059255A (ja) 2006-08-31 2006-08-31 情報入力装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006235108A JP2008059255A (ja) 2006-08-31 2006-08-31 情報入力装置、及びプログラム

Publications (1)

Publication Number Publication Date
JP2008059255A true JP2008059255A (ja) 2008-03-13

Family

ID=39241919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006235108A Pending JP2008059255A (ja) 2006-08-31 2006-08-31 情報入力装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP2008059255A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8897594B2 (en) 2012-01-17 2014-11-25 Fuji Xerox Co., Ltd. Image reader, mobile terminal apparatus, and non-transitory computer readable medium
JP2017224205A (ja) * 2016-06-16 2017-12-21 東芝テック株式会社 追跡管理システム及び事務機器並びにその制御プログラム
JP2020205082A (ja) * 2016-06-16 2020-12-24 東芝テック株式会社 サーバ及びその制御プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8897594B2 (en) 2012-01-17 2014-11-25 Fuji Xerox Co., Ltd. Image reader, mobile terminal apparatus, and non-transitory computer readable medium
JP2017224205A (ja) * 2016-06-16 2017-12-21 東芝テック株式会社 追跡管理システム及び事務機器並びにその制御プログラム
JP2020205082A (ja) * 2016-06-16 2020-12-24 東芝テック株式会社 サーバ及びその制御プログラム

Similar Documents

Publication Publication Date Title
JP3796500B2 (ja) 画像処理装置及びその制御方法、プログラム
JP2020173808A (ja) ページ記述言語ジョブの解析によるニューラルネットワーク用光学式文字認識トレーニングデータの生成
JP2011118569A (ja) 文書管理システム及びプログラム
JP6477585B2 (ja) 画像処理装置及び画像処理システム
WO2021070972A1 (en) Display apparatus, color supporting apparatus, display method, and program
CN102375981B (zh) 图像处理装置
CN107133615A (zh) 信息处理设备和信息处理方法
US20190146646A1 (en) Information processing system, information processing apparatus, and non-transitory computer readable medium
JP2017200119A5 (ja)
CN111738901A (zh) 存储介质以及图像处理装置
JP2008059255A (ja) 情報入力装置、及びプログラム
US11297205B2 (en) Image forming apparatus and non-transitory computer readable medium
JP5089524B2 (ja) 文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラム
JP2010157220A (ja) 背景に従ってバリアブルテキストカラーを使用するバリアブルデータプリント方法
US20150365543A1 (en) Information processing apparatus, and non-transitory computer readable medium
US11887391B2 (en) Information processing system, data output system, image processing method, and recording medium
US20070206883A1 (en) Image processing apparatus and recording medium recording image processing program
JP4543741B2 (ja) グラフ作成装置、プログラムおよび記録媒体
US11616891B2 (en) Information processing apparatus and non-transitory computer readable medium for analyzing an image capture in a time series with respect to content of parameter and making an assumption how user performed operation in an apparatus
JP2006270589A (ja) 情報処理装置、情報処理方法、プログラムおよび記録媒体
JP2002279351A (ja) 文字認識装置、文字認識方法ならびに文字認識プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP2020099031A (ja) 情報処理装置、及び情報処理方法
JP4741363B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
US9298714B2 (en) Information processing apparatus, information processing system, and non-transitory computer readable medium
JP7383882B2 (ja) 情報処理装置、及び情報処理プログラム