JP5670787B2 - 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム - Google Patents
情報処理装置、帳票種別推定方法および帳票種別推定用プログラム Download PDFInfo
- Publication number
- JP5670787B2 JP5670787B2 JP2011061567A JP2011061567A JP5670787B2 JP 5670787 B2 JP5670787 B2 JP 5670787B2 JP 2011061567 A JP2011061567 A JP 2011061567A JP 2011061567 A JP2011061567 A JP 2011061567A JP 5670787 B2 JP5670787 B2 JP 5670787B2
- Authority
- JP
- Japan
- Prior art keywords
- feature data
- feature
- processing target
- image data
- form type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する推定手段と、前記推定手段によって前記処理対象帳票の帳票種別が推定されなかった場合に、該処理対象帳票に係る特徴データを前記特徴データ蓄積手段に追加する特徴データ追加手段と、を備える情報処理装置である。
する所定の範囲内にある1または複数の特徴データを抽出してもよい。
図1は、本実施形態に係る帳票種別検索システム100の構成の概略を示す図である。帳票種別検索システム100は、ユーザ端末9とのインターフェースを提供するためのWebサーバ2と、帳票種別検索サービスを提供するためのアプリケーションサーバ1と、特徴データや画像データ等の各種情報が蓄積されるデータベース3(特徴データベース31および画像データベース32)と、が互いに接続されたシステムである。
構成要素の省略や置換、追加が可能である。例えば、アプリケーションサーバ1には、必要に応じてディスプレイやマウス、キーボード等の入出力装置が接続されてもよい。
ROM)やHDD(Hard Disk Drive)等を用いることが出来る。
票種別毎に、罫線の数、特徴点の数および色具合(RGBカラーヒストグラム)を保持するテーブルA(図3を参照)と、帳票の画像データに基づいて、罫線、特徴点および色具合について算出された特徴量を、当該帳票の帳票種別(帳票種別ID)に関連づけて保持するテーブルB(図4を参照)とが含まれる。
図5は、本実施形態に係る帳票種別識別・学習処理の流れを示すフローチャートである。本フローチャートに示された処理は、ユーザ端末9から送信された帳票の画像データが、Webサーバ2を介して受信されたことを契機として実行される。但し、本フローチャートに示された処理は予め蓄積された帳票の画像データに対して、バッチ処理されてもよい。なお、本実施形態においてフローチャートを用いて説明される処理の具体的な内容および順序等は、本発明を実施する上での一例である。具体的な処理内容および順序等は、実施の形態に応じて適宜選択されてよい。
103において後述するように、縦方向の罫線と横方向の罫線との交点が特徴点として抽出されるため、後述する特徴データの抽出および帳票種別の推定において、罫線同士の交点の重み付けが、罫線の縦横本数と交点とで二重に考慮されてしまわないようにするためである。その後、処理はステップS103へ進む。
について所定の許容範囲が設定されることで、完全一致しないが、近似する値を含むレコード、即ち、値がステップS102からステップS104において得られた値を基準とする所定の許容範囲内にあるレコードも抽出される。本ステップでは、罫線の数、特徴点の数および色具合の全てについて一致または近似する値を含むレコードのみが抽出される。但し、抽出の条件としては、罫線の数、特徴点の数および色具合の各パラメータについて、異なる重み付けが設定されていてもよい。本ステップにおける第一段階の絞り込みの結果、特徴データベース31から、1または複数のレコード(特徴データ)が抽出される。その後、処理はステップS107へ進む。
結果が正しい結果であったか否か、即ち、推定結果に係る帳票種別が、ステップS101において取得された画像データに係る帳票の帳票種別を正しく示しているか否か、を判定する(ステップS111)。
本実施形態に係る帳票種別検索システム100によれば、予め書式定義を作成することなく、帳票種別を推定することが出来る。また、未知の帳票種別については学習を行い、以後の帳票種別推定において、学習された帳票データを用いることが可能となる。
2 Webサーバ
3 データベース
9 ユーザ端末
21 画像データ取得部
22 特徴データ取得部
23 抽出部
24 推定部
25 特徴データ追加部
31 特徴データベース
32 画像データベース
Claims (9)
- 帳票の外観上の特徴に係る特徴データを、帳票種別毎に蓄積する特徴データ蓄積手段に接続される情報処理装置であって、
処理対象帳票の画像データを取得する画像データ取得手段と、
前記画像データから、前記処理対象帳票に係る特徴データを取得する特徴データ取得手段と、
前記特徴データ蓄積手段に蓄積されている特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する推定手段と、
前記推定手段によって推定された前記処理対象帳票の帳票種別を、ユーザに対して提示させる提示手段と、
前記推定手段によって推定された前記処理対象帳票の帳票種別が正しいか否かを、前記ユーザからの返信に基づいて判定する判定手段と、
前記判定手段によって、前記推定手段によって推定された前記処理対象帳票の帳票種別が正しいと判定されなかった場合に、該処理対象帳票に係る特徴データを前記特徴データ蓄積手段に追加する特徴データ追加手段と、
を備える情報処理装置。 - 前記特徴データ追加手段は、前記処理対象帳票に係る特徴データを、新たな帳票種別に係る特徴データとして前記特徴データ蓄積手段に追加する、
請求項1に記載の情報処理装置。 - 前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる所定のパラメータが、前記画像データから取得された所定のパラメータを基準とする所定の範囲内にある1または複数の特徴データを抽出する抽出手段を更に備え、
前記推定手段は、前記抽出手段によって抽出された特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する、
請求項1または2に記載の情報処理装置。 - 前記所定のパラメータは、前記画像データから取得された特徴点の数を特定可能な情報
を含み、
前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる特徴点の数が、前記画像データから取得された特徴点の数を基準とする所定の範囲内にある1または複数の特徴データを抽出する、
請求項3に記載の情報処理装置。 - 前記所定のパラメータは、前記画像データから取得された罫線の数を特定可能な情報を含み、
前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる罫線の数が、前記画像データから取得された罫線の数を基準とする所定の範囲内にある1または複数の特徴データを抽出する、
請求項3または4に記載の情報処理装置。 - 前記所定のパラメータは、前記画像データから取得された色具合を特定可能な情報を含み、
前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる色具合が、前記画像データから取得された色具合を基準とする所定の範囲内にある1または複数の特徴データを抽出する、
請求項3から5の何れか一項に記載の情報処理装置。 - 前記特徴データは、前記画像データから算出された特徴量を含み、
前記推定手段は、前記抽出手段によって抽出された特徴データに含まれる特徴量に対して、前記画像データから取得された特徴量を用いた最近傍探索を行うことで、該抽出された特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定し、該処理対象帳票の帳票種別を推定する、
請求項3から6の何れか一項に記載の情報処理装置。 - 帳票の外観上の特徴に係る特徴データを、帳票種別毎に蓄積する特徴データ蓄積手段に接続されるコンピュータが、
処理対象帳票の画像データを取得する画像データ取得ステップと、
前記画像データから、前記処理対象帳票に係る特徴データを取得する特徴データ取得ステップと、
前記特徴データ蓄積手段に蓄積されている特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する推定ステップと、
前記推定ステップで推定された前記処理対象帳票の帳票種別を、ユーザに対して提示させる提示ステップと、
前記推定ステップで推定された前記処理対象帳票の帳票種別が正しいか否かを、前記ユーザからの返信に基づいて判定する判定ステップと、
前記判定ステップにおいて、前記推定ステップで推定された前記処理対象帳票の帳票種別が正しいと判定されなかった場合に、該処理対象帳票に係る特徴データを前記特徴データ蓄積手段に追加する特徴データ追加ステップと、
を実行する帳票種別推定方法。 - 帳票の外観上の特徴に係る特徴データを、帳票種別毎に蓄積する特徴データ蓄積手段に接続されるコンピュータに、
処理対象帳票の画像データを取得する画像データ取得ステップと、
前記画像データから、前記処理対象帳票に係る特徴データを取得する特徴データ取得ステップと、
前記特徴データ蓄積手段に蓄積されている特徴データから、前記処理対象帳票に係る特
徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する推定ステップと、
前記推定ステップで推定された前記処理対象帳票の帳票種別を、ユーザに対して提示させる提示ステップと、
前記推定ステップで推定された前記処理対象帳票の帳票種別が正しいか否かを、前記ユーザからの返信に基づいて判定する判定ステップと、
前記判定ステップにおいて、前記推定ステップで推定された前記処理対象帳票の帳票種別が正しいと判定されなかった場合に、該処理対象帳票に係る特徴データを前記特徴データ蓄積手段に追加する特徴データ追加ステップと、
を実行させるための帳票種別推定用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011061567A JP5670787B2 (ja) | 2011-03-18 | 2011-03-18 | 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011061567A JP5670787B2 (ja) | 2011-03-18 | 2011-03-18 | 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012198684A JP2012198684A (ja) | 2012-10-18 |
JP5670787B2 true JP5670787B2 (ja) | 2015-02-18 |
Family
ID=47180851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011061567A Active JP5670787B2 (ja) | 2011-03-18 | 2011-03-18 | 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5670787B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10949135B2 (en) | 2019-03-27 | 2021-03-16 | Canon Kabushiki Kaisha | Print system, print setting prediction method, and non-transitory computer-readable storage medium |
US11632483B2 (en) | 2019-04-04 | 2023-04-18 | Canon Kabushiki Kaisha | Management system, information processing apparatus, data transmission destination prediction method, data transmission method, and non-transitory computer-readable storage medium |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6222541B2 (ja) * | 2013-03-05 | 2017-11-01 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
JP7181445B2 (ja) * | 2017-11-30 | 2022-12-01 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、その制御方法とプログラム |
JP2019169025A (ja) * | 2018-03-26 | 2019-10-03 | 株式会社Pfu | 情報処理装置、文字認識エンジン選択方法及びプログラム |
JP7160432B2 (ja) * | 2018-04-02 | 2022-10-25 | 日本電気株式会社 | 画像処理装置、画像処理方法、プログラム |
JP6736742B1 (ja) * | 2019-10-28 | 2020-08-05 | Tis株式会社 | 帳票処理プログラム、帳票処理装置、帳票処理方法 |
US11438477B2 (en) | 2020-01-16 | 2022-09-06 | Fujifilm Business Innovation Corp. | Information processing device, information processing system and computer readable medium |
JP7420578B2 (ja) | 2020-02-06 | 2024-01-23 | 株式会社Nttデータ | 帳票仕分システム、帳票仕分方法、及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08335247A (ja) * | 1995-06-08 | 1996-12-17 | Oki Electric Ind Co Ltd | フォーマット情報生成方法及びフォーマット情報生成装置 |
JP3851742B2 (ja) * | 1999-03-31 | 2006-11-29 | 株式会社東芝 | 帳票処理方法及び装置 |
JP4592984B2 (ja) * | 2000-03-10 | 2010-12-08 | 富士通株式会社 | 画像照合装置、画像照合方法、及び画像照合プログラム |
JP5060053B2 (ja) * | 2006-01-20 | 2012-10-31 | 富士通株式会社 | 媒体判別情報データベース作成装置及び媒体判別情報データベース管理装置 |
JP4418823B2 (ja) * | 2007-01-19 | 2010-02-24 | 富士通株式会社 | 帳票識別装置及びその識別方法 |
-
2011
- 2011-03-18 JP JP2011061567A patent/JP5670787B2/ja active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10949135B2 (en) | 2019-03-27 | 2021-03-16 | Canon Kabushiki Kaisha | Print system, print setting prediction method, and non-transitory computer-readable storage medium |
US11632483B2 (en) | 2019-04-04 | 2023-04-18 | Canon Kabushiki Kaisha | Management system, information processing apparatus, data transmission destination prediction method, data transmission method, and non-transitory computer-readable storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP2012198684A (ja) | 2012-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5670787B2 (ja) | 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム | |
JP6629678B2 (ja) | 機械学習装置 | |
EP2461273A2 (en) | Method and system for machine-learning based optimization and customization of document similarities calculation | |
US20190294912A1 (en) | Image processing device, image processing method, and image processing program | |
CN103136228A (zh) | 一种图片搜索方法以及图片搜索装置 | |
CN111177507B (zh) | 多标记业务处理的方法及装置 | |
US11803872B2 (en) | Creating meta-descriptors of marketing messages to facilitate in delivery performance analysis, delivery performance prediction and offer selection | |
JP2011198364A (ja) | 媒体文書へのラベル添加方法及び該方法を用いるシステム | |
US20150242964A1 (en) | Non-transitory Computer-Readable Medium, Data Management System and Data Management Server | |
US7971135B2 (en) | Method and system for automatic data aggregation | |
JP6377917B2 (ja) | 画像検索装置及び画像検索プログラム | |
JP5423380B2 (ja) | 情報処理プログラム及び情報処理方法 | |
JP5455978B2 (ja) | パターン抽出装置及び方法 | |
CN116484109B (zh) | 基于人工智能的客户画像分析系统及方法 | |
KR102028356B1 (ko) | 코멘트 기반의 광고 추천 장치 및 방법 | |
KR102163125B1 (ko) | 해시태그 기반 이미지 콘테스트를 통한 마케팅 방법 | |
CN109727056B (zh) | 金融机构推荐方法、设备、存储介质及装置 | |
CN110580297A (zh) | 基于菜品图像的商户及菜品匹配方法、装置、电子设备 | |
WO2021059848A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP7272037B2 (ja) | 情報処理装置及びプログラム | |
KR102393517B1 (ko) | 풀필먼트 서비스를 제공하는 방법 및 그를 위한 서비스 시스템 | |
CN112307298B (zh) | 个人品牌标签的生成方法及其装置 | |
JP2018067215A (ja) | データ分析システム、その制御方法、プログラム、及び、記録媒体 | |
CN113971581A (zh) | 一种机器人的控制方法、装置、终端设备及存储介质 | |
KR20190104745A (ko) | 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130618 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140509 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5670787 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |