JP7283755B2 - 情報処理装置、及びプログラム - Google Patents
情報処理装置、及びプログラム Download PDFInfo
- Publication number
- JP7283755B2 JP7283755B2 JP2020073658A JP2020073658A JP7283755B2 JP 7283755 B2 JP7283755 B2 JP 7283755B2 JP 2020073658 A JP2020073658 A JP 2020073658A JP 2020073658 A JP2020073658 A JP 2020073658A JP 7283755 B2 JP7283755 B2 JP 7283755B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- information
- input
- candidate
- input field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
(1)XXストア
(2)X県Y市Z-A
(3)M月D日H時m分
(4)雑
(5)貨
(6)1点 @240
(7)240
(8)α錠剤
(9)1点…@500
(10)500
(11)小計
(12)740
(13)税
(14)10%
(15)74
(16)合計
(17)814
となっているものとする。
クラスタ1.「XXストア」
クラスタ2.「X県Y市Z-A」
クラスタ3.「M月D日H時m分」
クラスタ4.「雑 貨」
クラスタ5.「1点…@240」
クラスタ6.「240」
クラスタ7.「α錠剤」
クラスタ8.「1点…@500」
クラスタ9.「500」
クラスタ10.「小計」
クラスタ11.「740」
…
といったように、OCR等により得られた文字列情報が、複数のクラスタに分割され、クラスタごとの分割文字列情報が得られる。
本実施の形態の例に係る情報処理装置1は、以上の構成を備えており、次のように動作する。情報処理装置1のユーザは、スキャナ装置2を操作して紙面等の媒体(レシート等)に形成された画像を光学的に読み取らせる。スキャナ装置2は、レシート等を光学的に読み取って得た画像データを、文書情報として情報処理装置1に出力する。
クラスタ1.「XXストア」
クラスタ2.「X県Y市Z-A」
クラスタ3.「M月D日H時m分」
クラスタ4.「雑 貨」
クラスタ5.「1点…@240」
クラスタ6.「240」
クラスタ7.「α錠剤」
クラスタ8.「1点…@500」
クラスタ9.「500」
クラスタ10.「小計」
クラスタ11.「740」
…
といったように分割文字列情報を得る。
またここまでの説明では、情報処理装置1の制御部11は、候補設定部24としての動作を行う際に、分割または統合して得られた分割文字列情報のうち、入力文字列候補として設定する分割文字列情報を、分割文字列情報の長さ(分割文字列情報に含まれる文字数)に基づいて設定することとしていた。しかしながら入力文字列候補の条件は、これに限られない。
「*県*市*」
等予め列挙した候補パターンに合致する分割文字列情報を入力文字列候補として設定する。また候補設定部24は、別に列挙した、
「*点…@*」
等の非候補パターンに合致する分割文字列情報を入力文字列候補として設定しないよう制御してもよい。ここで「*」は、任意の1文字に合致することを表す正規表現であるとする。また、列挙された候補パターンや非候補パターンに合致しない分割文字列情報については、予め、入力文字列候補として設定するか否かを定めておき、候補設定部24は、当該定めに従って入力文字列候補として設定する(あるいは設定しない)こととすればよい。
「*[都道府県]*[市区町村]*[町]*」
などと設定し、また、「購入項目」については、非候補パターンとして
「[0-9]+」
などと設定しておく。ここで[ABC]または[A-C]は、A,B,Cのいずれかに合致するものとし、「+」は直前の種類の文字を1以上配列したパターンであることを示す。つまり、「[0-9]+」は数値のみからなることを意味する。
クラスタ1.「XXストア」 購入店舗,購入項目
クラスタ2.「X県Y市Z-A」 住所
クラスタ3.「M月D日H時m分」 購入日
クラスタ4.「雑 貨」 購入店舗,購入項目
クラスタ5.「1点…@240」 (なし)
クラスタ6.「240」 購入金額
…
というように、入力欄ごとに入力文字列候補が設定される。
また入力文字列候補は、OCRにより得られた文字列情報に基づいて候補設定部24が設定したものに限らなくてもよい。情報処理装置1は、予めユーザや管理者等から設定された文字列情報を、入力文字列候補(以下、候補設定部24が設定したものと区別するため、事前候補と呼ぶ)として記憶しておき、ユーザが入力欄を指定したときに、候補設定部24が設定した入力文字列候補とともに、当該予め記憶している事前候補を含めて、入力する文字列の候補として選択可能な状態で表示してもよい。
また本実施の形態では情報入力部25は、図5に例示したように文書情報を表示する際、分割統合処理部23が得たクラスタごとに、当該クラスタに属する分割文字列情報に係る外接矩形領域を重ね合わせて表示してもよい。この外接矩形領域はクラスタに含めた文字列情報(分割前の文字列情報)の各外接矩形領域にさらに外接する矩形領域とする。
また本実施の形態の例では、候補設定部24が候補パターン(または非候補パターン)として、予め設定された候補辞書(あるいは非候補辞書)に登録された文字列を用いてもよい。この例では、候補設定部24は、分割文字列情報のうち、予め設定された候補辞書に登録された文字列と類似すると判断される文字列情報を、入力文字列候補とする。また候補設定部24は、分割文字列情報のうち、予め設定された非候補辞書に登録された文字列と類似すると判断される文字列情報を、入力文字列候補としないよう制御してもよい。
このように本実施の形態によると、スキャナ装置2により読み取られた画像データ(文書情報)からOCR等の文字認識処理で抽出され、さらに所定の単位に分割または統合して得られた文字列情報(分割文字列情報)を、入力欄への情報入力の際のオートコンプリートの候補として設定する。これにより読み取られた文書情報のフォームが複数種類あったとしても、当該互いに異なるフォームの帳票に基づく情報入力を支援できる。
Claims (6)
- スキャンされて得られた文書情報を取得する取得手段と、
前記取得した文書情報から、文字認識処理により文字列情報を抽出する抽出手段と、
前記抽出した文字列情報を所定の規則に基づいて分割または統合する分割統合手段と、
前記分割または統合して得られた文字列情報のうち、その長さが予め定めた条件を満足する文字列情報を入力情報の候補として設定する候補設定手段と、
ユーザが入力欄へ文字列を入力する際に、前記候補設定手段が設定した入力情報の候補を提示する提示手段と、
を含み、
前記候補設定手段は、前記分割または統合して得られた文字列情報が、その長さが前記予め定めた条件を満足し、かつ、入力欄ごとに予め定められた所定の非候補パターンに合致しないとの条件を満足するときに、当該分割または統合して得られた文字列情報を入力欄ごとの入力情報の候補として設定し、
前記提示手段は、ユーザが入力欄へ文字列を入力する際に、当該入力欄に関連して前記候補設定手段が設定した入力情報の候補を提示する情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記提示手段は、前記分割または統合して得られた文字列情報が、入力欄ごとに予め定められた所定の候補パターンに合致するときに、当該分割または統合して得られた文字列情報を入力欄ごとの入力情報の候補として設定する候補設定手段と、
ユーザが入力欄へ文字列を入力する際に、当該入力欄に関連して前記候補設定手段が設定した入力情報の候補を提示する情報処理装置。 - 請求項1または2に記載の情報処理装置であって、
前記候補設定手段は、予め文字列を登録した候補辞書を参照し、前記分割または統合して得られた文字列情報に類似すると判断される文字列が、前記候補辞書に登録されているときに、当該文字列情報または前記候補辞書に登録された、当該文字列情報に類似する文字列を入力情報の候補として設定する情報処理装置。 - 請求項3に記載の情報処理装置であって、
前記候補辞書に登録される文字列には、当該文字列が入力され得る入力欄を特定する情報が関連付けられており、
前記候補設定手段は、ユーザが入力欄へ文字列を入力する際に、当該入力欄を特定する情報に関連付けて登録された文字列であって、前記分割または統合して得られた文字列情報に類似すると判断される文字列が、前記候補辞書に登録されているときに、当該文字列情報または前記候補辞書に登録された、当該文字列情報に類似する文字列を入力情報の候補として設定する情報処理装置。 - 請求項1から4のいずれか一項に記載の情報処理装置であって、
前記提示手段は、さらに、ユーザが入力欄へ文字列を入力する際に、当該入力欄に関連して前記候補設定手段が設定した入力情報の候補とともに、予め記憶している事前候補を含めて入力情報の候補として提示する情報処理装置。 - 予め定められた入力欄に対してユーザが情報を入力する操作を支援する情報処理装置を、
スキャンされて得られた文書情報を取得する取得手段と、
前記取得した文書情報から、文字認識処理により文字列情報を抽出する抽出手段と、
前記抽出した文字列情報を所定の規則に基づいて分割または統合する分割統合手段と、
前記分割または統合して得られた文字列情報のうち、その長さが予め定めた条件を満足する文字列情報を入力情報の候補として設定する候補設定手段と、
ユーザが入力欄へ文字列を入力する際に、前記候補設定手段が設定した入力情報の候補を提示する提示手段と、
として機能させ、
前記候補設定手段として機能させる際には、情報処理装置に、前記分割または統合して得られた文字列情報が、その長さが前記予め定めた条件を満足し、かつ、入力欄ごとに予め定められた所定の非候補パターンに合致しないとの条件を満足するときに、当該分割または統合して得られた文字列情報を入力欄ごとの入力情報の候補として設定させ、
前記提示手段として機能させる際には、情報処理装置に、ユーザが入力欄へ文字列を入力する際に、当該入力欄に関連して前記候補設定手段が設定した入力情報の候補を提示させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020073658A JP7283755B2 (ja) | 2020-04-16 | 2020-04-16 | 情報処理装置、及びプログラム |
JP2022207648A JP7527574B2 (ja) | 2020-04-16 | 2022-12-23 | 情報処理装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020073658A JP7283755B2 (ja) | 2020-04-16 | 2020-04-16 | 情報処理装置、及びプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022207648A Division JP7527574B2 (ja) | 2020-04-16 | 2022-12-23 | 情報処理装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021170276A JP2021170276A (ja) | 2021-10-28 |
JP7283755B2 true JP7283755B2 (ja) | 2023-05-30 |
Family
ID=78119561
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020073658A Active JP7283755B2 (ja) | 2020-04-16 | 2020-04-16 | 情報処理装置、及びプログラム |
JP2022207648A Active JP7527574B2 (ja) | 2020-04-16 | 2022-12-23 | 情報処理装置、及びプログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022207648A Active JP7527574B2 (ja) | 2020-04-16 | 2022-12-23 | 情報処理装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7283755B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010170461A (ja) | 2009-01-26 | 2010-08-05 | Fujitsu Ltd | 清書支援プログラム及び清書支援方法 |
JP2019169026A (ja) | 2018-03-26 | 2019-10-03 | 株式会社Pfu | 情報処理装置、文字認識エンジン最適化方法及びプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05258099A (ja) * | 1992-03-16 | 1993-10-08 | Fujitsu Ltd | 文字認識処理装置 |
JPH08263587A (ja) * | 1995-03-20 | 1996-10-11 | Matsushita Electric Ind Co Ltd | 文書入力方法および文書入力装置 |
JP4982587B2 (ja) | 2010-05-07 | 2012-07-25 | 株式会社東芝 | データエントリシステムおよびデータエントリ方法 |
JP5508359B2 (ja) * | 2011-08-03 | 2014-05-28 | シャープ株式会社 | 文字認識装置、文字認識方法及びプログラム |
JP2018197996A (ja) | 2017-05-24 | 2018-12-13 | グローリー株式会社 | 入力支援装置、自動取引装置、入力支援システム、入力支援方法および入力支援プログラム |
JP6289720B1 (ja) | 2017-10-06 | 2018-03-07 | ラクラス株式会社 | 年末調整業務支援システム |
-
2020
- 2020-04-16 JP JP2020073658A patent/JP7283755B2/ja active Active
-
2022
- 2022-12-23 JP JP2022207648A patent/JP7527574B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010170461A (ja) | 2009-01-26 | 2010-08-05 | Fujitsu Ltd | 清書支援プログラム及び清書支援方法 |
JP2019169026A (ja) | 2018-03-26 | 2019-10-03 | 株式会社Pfu | 情報処理装置、文字認識エンジン最適化方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7527574B2 (ja) | 2024-08-05 |
JP2021170276A (ja) | 2021-10-28 |
JP2023036834A (ja) | 2023-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6651221B1 (en) | System and methods for spacing, storing and recognizing electronic representations of handwriting, printing and drawings | |
CN101430758A (zh) | 文档识别装置和方法 | |
JPH04343190A (ja) | 文字データ入力方式 | |
JPH09134349A (ja) | 情報処理装置並びに文書作成方法及び帳表作成方法 | |
JPH03175593A (ja) | オンライン文字認識装置 | |
US20110225526A1 (en) | System and Method for Processing Objects | |
JP5247311B2 (ja) | 電子文書処理装置および電子文書処理方法 | |
JP2005216203A (ja) | 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置 | |
JP7283755B2 (ja) | 情報処理装置、及びプログラム | |
JPWO2016170691A1 (ja) | 入力処理プログラム、入力処理装置、入力処理方法、文字特定プログラム、文字特定装置、及び文字特定方法 | |
JP5424269B2 (ja) | 局所対応抽出装置及び局所対応抽出方法 | |
JP4005672B2 (ja) | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 | |
JP3422157B2 (ja) | 手書き文字入力装置および手書き文字入力方法 | |
JPH11110119A (ja) | スケジュール入力装置およびスケジュール入力装置制御プログラムを記録した媒体 | |
JP3715431B2 (ja) | 組版方法、組版装置、及び、その処理を実行するためのプログラムを記録した記録媒体 | |
JPH1153398A (ja) | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 | |
JP7456131B2 (ja) | 情報処理システム、情報処理方法及びプログラム | |
JP4967934B2 (ja) | 画像処理装置及びプログラム | |
US20210157969A1 (en) | Information processing system, information processing apparatus, and non-transitory computer readable medium storing program | |
WO2021117128A1 (ja) | 帳票画像処理システム | |
JPS59103122A (ja) | カ−ド・イメ−ジ処理デ−タ処理装置における表作成制御方式 | |
JP2023047180A (ja) | 情報処理装置、及び情報処理プログラム | |
JPH04157560A (ja) | 表作成方法 | |
JP4462508B2 (ja) | 情報処理装置並びに定義情報生成方法 | |
JPH05120358A (ja) | 画像情報処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210430 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221025 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221223 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230418 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230511 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7283755 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |