JP7271987B2 - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP7271987B2 JP7271987B2 JP2019024333A JP2019024333A JP7271987B2 JP 7271987 B2 JP7271987 B2 JP 7271987B2 JP 2019024333 A JP2019024333 A JP 2019024333A JP 2019024333 A JP2019024333 A JP 2019024333A JP 7271987 B2 JP7271987 B2 JP 7271987B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- string
- attribute
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
認識された前記文字の中に第1の文字又は文字列が含まれない場合に、該第1の文字又は文字列と共通の属性を有する第2の文字又は文字列を除外して、前記属性を示す第3の文字又は文字列を含む第4の文字又は文字列を抽出する抽出手段と、
前記抽出手段による抽出の対象として文字又は文字列を登録する登録手段とを備え、
前記登録手段により前記第1の文字又は文字列と共通の属性を有する第5の文字又は文字列が新たに前記抽出の対象として登録された場合に、前記抽出手段は、該第5の文字又は文字列をさらに除外して、前記属性を示す第3の文字又は文字列を含む第4の文字又は文字列を抽出する、情報処理装置。
[2]複数の前記第1の文字又は文字列を前記抽出の対象としてそれぞれ記録する複数の記録手段と、
前記複数の記録手段のうち、前記第5の文字又は文字列を前記抽出の対象として記録する記録手段以外の記録手段のそれぞれに、前記第5の文字又は文字列を前記抽出手段による抽出から除外する除外条件として追加する追加手段と、
をさらに備える、前記[1]に記載の情報処理装置。
[3]複数の前記第1の文字又は文字列を前記抽出の対象としてそれぞれ記録する複数の記録手段と、
前記第1の文字又は文字列の属性に応じて前記記録手段を群に分類した分類情報の中から、前記複数の記録手段のうち前記第1の文字又は文字列が記録された第1の記録手段と同一の群に属する第2の記録手段に記録された前記第1の文字又は文字列を前記第2の文字又は文字列として前記第1の記録手段に追加する追加手段と、をさらに備える、前記[1]に記載の情報処理装置。
[4]前記追加手段は、前記第1の記録手段が属する群の名称を示す文字又は文字列を前記第3の文字又は文字列として前記第1の記録手段に追加する、前記[3]に記載の情報処理装置。
[5]前記第1の文字又は文字列を記録する記録手段と、
前記第1の文字又は文字列を属性に応じて前記記録手段を群に分類する分類手段と、
前記群に分類された前記記録手段が予め定められた個数以上となった場合に、新たな群を生成する生成手段と、をさらに備える、前記[1]に記載の情報処理装置。
[6]前記生成手段は、前記属性を付して前記新たな群を生成する、前記[5]に記載の情報処理装置。
[7]コンピュータを、文字を認識する認識手段と、
認識された前記文字の中に第1の文字又は文字列が含まれない場合に、該第1の文字は文字列と共通の属性を有する第2の文字又は文字列を除外して、前記属性を示す第3の文字又は文字列を含む第4の文字又は文字列を抽出する抽出手段と、
前記抽出手段による抽出の対象として文字又は文字列を登録する登録手段として、機能させるためのプログラムであって、
前記登録手段により前記第1の文字又は文字列と共通の属性を有する第5の文字又は文字列が新たに前記抽出の対象として登録された場合に、前記抽出手段は、該第5の文字又は文字列をさらに除外して、前記属性を示す第3の文字又は文字列を含む第4の文字又は文字列を抽出する、プログラム。
(情報処理装置の構成)
図1は、本発明の実施の形態に係る情報処理装置の制御系の一例を示すブロック図である。このような情報処理装置1には、例えば、パーソナルコンピュータ、画像形成装置、タブレッド端末、多機能携帯電話機(スマートフォン)等が含まれる。以下、情報処理装置1として、スキャン機能、プリンタ機能、コピー機能、ファクシミリ機能、電子メール機能等の複数の機能を有する複合機を例に説明するが、情報処理装置1は、複合機に限定されるものではない。
次に、記憶部11に記憶された各種データの詳細について説明する。形態素情報111は、文字又は文字列の形態素の解析に用いる単語の品詞等の情報である。
次に、制御部10を構成する各手段の詳細について説明する。生成手段100は、ユーザによるキーを設定及び登録する操作に応じて、抽出キー114aとして指定キーが記録された定義ファイル114を生成する。
次に、情報処理装置1の動作の一例について説明する。以下の説明では、(1)画像として取り込まれる文書、(2)定義ファイル114の設定及び登録の動作、及び(3)文書を読み取った読取画像(以下、単に「文書画像」ともいう。)から指定されたキーとバリュー値とを抽出する処理(以下、「キーバリュー処理」ともいう。)に係る動作、に分けて説明する。
図5は、動作の説明に用いる文書としての見積書の一例を示す図であり、(a)は、第1の見積書の一例を示す図、(b)は、第2の見積書の一例を示す図である。図5(a)に示すように、第1の見積書7Aには、例えば、見積りの番号を示す見積番号情報75が含まれている。また、図5(b)に示すように、第2の見積書7Bは、例えば、見積りの番号を示す見積番号情報75Bに加えて、口座番号等の振り込み先を示す振込先情報74が含まれている。
次に、図6を参照して、定義ファイル114の設定及び登録の動作について説明する。図6は、定義ファイル114の設定及び登録の動作の一例を示すフローチャートである。図6に示すように、まず、表示制御手段106は、操作表示部12の表示面に選択画面61(図4(a)参照)を表示するよう制御する(S1)。
次に、図7を参照して、キーバリュー処理に係る動作について説明する。図7は、キーバリュー処理の動作の一例を模式的に示す図である。定義ファイル114として、上述した第2の定義ファイル114Bを用いる場合を例に挙げて説明する。
次に、図9を参照して、変形例2について説明する。図9は、定義ファイル114の一例を示す図、(b)は、第3の見積書の一例を示す図である。図9(a)に示すように、例えば、「参照」との文字列を除外条件である除外キー114bとして記録してもよい。「参照」との文字列が抽出の対象から除外されると、図9(b)に示すように、第3の見積書7C内に備考として記載された参照情報711が含まれている場合であっても、抽出手段105は、かかる参照情報711を抽出の対象から除外して、請求の番号を示す請求番号情報71を抽出してもよい。
次に、図10を参照して、変形例3について説明する。図10(a)及び(b)は、定義ファイルリスト113の一例を示す図である。生成手段100は、上述の実施の形態で説明した機能に加えて、定義ファイルリスト113に新たなグループを生成する機能をさらに有している。
10…制御部
100…生成手段
101…解析手段
102…判定手段
103…追加手段
104…認識手段
105…抽出手段
106…表示制御手段
11…記憶部
110…プログラム
111…形態素情報
113…定義ファイルリスト
113a…第1のグループ
113b…第2のグループ
113c…第3のグループ
113d…第4のグループ
113e…第5のグループ
114…定義ファイル
114A…第1の定義ファイル
114B…第2の定義ファイル
114C…第3の定義ファイル
114D…第4の定義ファイル
114a…抽出キー
114b…除外キー
115…画面情報
116…情報
12…操作表示部
14…画像読取部
15…画像出力部
16…ファクシミリ通信部
17…ネットワーク通信部
2…外部ファクシミリ装置
3…外部装置
4…公衆回線網
5…ネットワーク
61…選択画面
62…設定画面
63…確認画面
611A…第1の釦
611B…第2の釦
612A…第3の釦
612B…第4の釦
621…設定釦
622…登録釦
631…属性欄
632…値欄
7A…第1の見積書
7B…第2の見積書
7C…第3の見積書
70B…文字情報
71…請求番号情報
74…振込先情報
75,75B…見積番号情報
711…参照情報
Claims (7)
- 文字を認識する認識手段と、
認識された前記文字の中に第1の文字又は文字列が含まれない場合に、該第1の文字又は文字列と共通の属性を有する第2の文字又は文字列を除外して、前記属性を示す第3の文字又は文字列を含む第4の文字又は文字列を抽出する抽出手段と、
前記抽出手段による抽出の対象として文字又は文字列を登録する登録手段とを備え、
前記登録手段により前記第1の文字又は文字列と共通の属性を有する第5の文字又は文字列が新たに前記抽出の対象として登録された場合に、前記抽出手段は、該第5の文字又は文字列をさらに除外して、前記属性を示す第3の文字又は文字列を含む第4の文字又は文字列を抽出する、
情報処理装置。 - 複数の前記第1の文字又は文字列を前記抽出の対象としてそれぞれ記録する複数の記録手段と、
前記複数の記録手段のうち、前記第5の文字又は文字列を前記抽出の対象として記録する記録手段以外の記録手段のそれぞれに、前記第5の文字又は文字列を前記抽出手段による抽出から除外する除外条件として追加する追加手段と、
をさらに備える、
請求項1に記載の情報処理装置。 - 複数の前記第1の文字又は文字列を前記抽出の対象としてそれぞれ記録する複数の記録手段と、
前記第1の文字又は文字列の属性に応じて前記記録手段を群に分類した分類情報の中から、前記複数の記録手段のうち前記第1の文字又は文字列が記録された第1の記録手段と同一の群に属する第2の記録手段に記録された前記第1の文字又は文字列を前記第2の文字又は文字列として前記第1の記録手段に追加する追加手段と、
をさらに備える、
請求項1に記載の情報処理装置。 - 前記追加手段は、前記第1の記録手段が属する群の名称を示す文字又は文字列を前記第3の文字又は文字列として前記第1の記録手段に追加する、
請求項3に記載の情報処理装置。 - 前記第1の文字又は文字列を記録する記録手段と、
前記第1の文字又は文字列を属性に応じて前記記録手段を群に分類する分類手段と、
前記群に分類された前記記録手段が予め定められた個数以上となった場合に、新たな群を生成する生成手段と、
をさらに備える、
請求項1に記載の情報処理装置。 - 前記生成手段は、前記属性を付して前記新たな群を生成する、
請求項5に記載の情報処理装置。 - コンピュータを、
文字を認識する認識手段と、
認識された前記文字の中に第1の文字又は文字列が含まれない場合に、該第1の文字は文字列と共通の属性を有する第2の文字又は文字列を除外して、前記属性を示す第3の文字又は文字列を含む第4の文字又は文字列を抽出する抽出手段と、
前記抽出手段による抽出の対象として文字又は文字列を登録する登録手段として、機能させるためのプログラムであって、
前記登録手段により前記第1の文字又は文字列と共通の属性を有する第5の文字又は文字列が新たに前記抽出の対象として登録された場合に、前記抽出手段は、該第5の文字又は文字列をさらに除外して、前記属性を示す第3の文字又は文字列を含む第4の文字又は文字列を抽出する、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019024333A JP7271987B2 (ja) | 2019-02-14 | 2019-02-14 | 情報処理装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019024333A JP7271987B2 (ja) | 2019-02-14 | 2019-02-14 | 情報処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020135095A JP2020135095A (ja) | 2020-08-31 |
JP7271987B2 true JP7271987B2 (ja) | 2023-05-12 |
Family
ID=72263046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019024333A Active JP7271987B2 (ja) | 2019-02-14 | 2019-02-14 | 情報処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7271987B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021064209A (ja) * | 2019-10-15 | 2021-04-22 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005182772A (ja) | 2003-11-28 | 2005-07-07 | Sharp Corp | 文字認識装置、プログラムおよび記録媒体 |
JP2008102737A (ja) | 2006-10-19 | 2008-05-01 | Nippon Telegr & Teleph Corp <Ntt> | 蓄積文書分類装置、蓄積文書分類方法、プログラムおよび記録媒体 |
JP2009015395A (ja) | 2007-06-29 | 2009-01-22 | Toshiba Corp | 辞書構築支援装置および辞書構築支援プログラム |
JP2009093659A (ja) | 2007-10-10 | 2009-04-30 | Nhn Corp | 文書探索サービス提供方法及びシステム |
JP2011081454A (ja) | 2009-10-02 | 2011-04-21 | Sharp Corp | 情報処理装置、情報処理方法、プログラムおよび記録媒体 |
JP2011107966A (ja) | 2009-11-17 | 2011-06-02 | Hitachi Solutions Ltd | 文書処理装置 |
JP2011198285A (ja) | 2010-03-23 | 2011-10-06 | Hitachi Solutions Ltd | 文書処理システム、及びプログラム |
WO2012095971A1 (ja) | 2011-01-13 | 2012-07-19 | 三菱電機株式会社 | 分類ルール生成装置、分類ルール生成方法、分類ルール生成プログラム及び記録媒体 |
JP2014071697A (ja) | 2012-09-28 | 2014-04-21 | Omron Corp | 画像処理システムおよび画像処理方法 |
JP2016018365A (ja) | 2014-07-08 | 2016-02-01 | シャープ株式会社 | データ処理装置、データ処理システム、データ表示装置、データ処理方法、表示方法およびプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11203415A (ja) * | 1998-01-16 | 1999-07-30 | Fuji Xerox Co Ltd | 類似パターンカテゴリ識別辞書作成装置および方法 |
-
2019
- 2019-02-14 JP JP2019024333A patent/JP7271987B2/ja active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005182772A (ja) | 2003-11-28 | 2005-07-07 | Sharp Corp | 文字認識装置、プログラムおよび記録媒体 |
JP2008102737A (ja) | 2006-10-19 | 2008-05-01 | Nippon Telegr & Teleph Corp <Ntt> | 蓄積文書分類装置、蓄積文書分類方法、プログラムおよび記録媒体 |
JP2009015395A (ja) | 2007-06-29 | 2009-01-22 | Toshiba Corp | 辞書構築支援装置および辞書構築支援プログラム |
JP2009093659A (ja) | 2007-10-10 | 2009-04-30 | Nhn Corp | 文書探索サービス提供方法及びシステム |
JP2011081454A (ja) | 2009-10-02 | 2011-04-21 | Sharp Corp | 情報処理装置、情報処理方法、プログラムおよび記録媒体 |
JP2011107966A (ja) | 2009-11-17 | 2011-06-02 | Hitachi Solutions Ltd | 文書処理装置 |
JP2011198285A (ja) | 2010-03-23 | 2011-10-06 | Hitachi Solutions Ltd | 文書処理システム、及びプログラム |
WO2012095971A1 (ja) | 2011-01-13 | 2012-07-19 | 三菱電機株式会社 | 分類ルール生成装置、分類ルール生成方法、分類ルール生成プログラム及び記録媒体 |
JP2014071697A (ja) | 2012-09-28 | 2014-04-21 | Omron Corp | 画像処理システムおよび画像処理方法 |
JP2016018365A (ja) | 2014-07-08 | 2016-02-01 | シャープ株式会社 | データ処理装置、データ処理システム、データ表示装置、データ処理方法、表示方法およびプログラム |
Non-Patent Citations (2)
Title |
---|
勝山 裕、外4名,"形態素解析とキーワード領域内の候補文字ラティス情報を用いた単語照合による文書画像の高精度検索方式",電子情報通信学会論文誌,日本,社団法人電子情報通信学会,2005年08月01日,Vol.J88-D-II, No.8,pp.1740-1749 |
山田 敬之、外2名,"各属性のレビュー・評価値の関係を用いた評判情報の検索支援",電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2008年01月31日,Vol.107, No.480,pp.1-6 |
Also Published As
Publication number | Publication date |
---|---|
JP2020135095A (ja) | 2020-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5774597B2 (ja) | 動的変動ネットワークを使用するシステムおよび方法 | |
US8630852B2 (en) | Image processing apparatus, speech recognition processing apparatus, control method for speech recognition processing apparatus, and computer-readable storage medium for computer program | |
JPH08305731A (ja) | 文書格納等の方法及び文書サーバ | |
JP2006350664A (ja) | 文書処理装置 | |
JP5730890B2 (ja) | 動的変動ネットワークを使用するシステムおよび方法 | |
JP6786658B2 (ja) | 書類読取システム | |
US20090002742A1 (en) | Image input/output apparatus and image input/output method | |
JP2008310772A (ja) | 情報処理装置、その制御プログラムおよび該制御プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに制御方法 | |
JP7271987B2 (ja) | 情報処理装置及びプログラム | |
US20210287187A1 (en) | Image processing apparatus and non-transitory computer readable medium storing program | |
US11657367B2 (en) | Workflow support apparatus, workflow support system, and non-transitory computer readable medium storing program | |
JP6856916B1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP4682747B2 (ja) | 文書処理装置、ルールデータ生成方法およびプログラム | |
JP7268389B2 (ja) | 情報処理装置及びプログラム | |
CN108875570B (zh) | 信息处理装置、存储介质和信息处理方法 | |
JP2021056722A (ja) | 情報処理装置及びプログラム | |
JP4281719B2 (ja) | ファイル処理装置、ファイル処理方法、およびファイル処理プログラム | |
JP4827519B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
US11363162B2 (en) | System and method for automated organization of scanned text documents | |
JP7408340B2 (ja) | 画像処理装置の制御方法、プログラム及び画像処理装置 | |
JP2011095889A (ja) | 画像読取装置 | |
JP2010072850A (ja) | 画像処理装置 | |
JP6281739B2 (ja) | 処理装置及びプログラム | |
JP4645349B2 (ja) | 情報処理装置およびプログラム | |
JP7439553B2 (ja) | 制御プログラム、情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230309 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230328 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230410 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7271987 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |