JP2020115260A - 情報処理装置、及び情報処理プログラム - Google Patents
情報処理装置、及び情報処理プログラム Download PDFInfo
- Publication number
- JP2020115260A JP2020115260A JP2019006192A JP2019006192A JP2020115260A JP 2020115260 A JP2020115260 A JP 2020115260A JP 2019006192 A JP2019006192 A JP 2019006192A JP 2019006192 A JP2019006192 A JP 2019006192A JP 2020115260 A JP2020115260 A JP 2020115260A
- Authority
- JP
- Japan
- Prior art keywords
- document
- information
- keyword
- candidate
- priority information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00912—Arrangements for controlling a still picture apparatus or components thereof not otherwise provided for
- H04N1/00915—Assigning priority to, or interrupting, a particular operation
- H04N1/00923—Variably assigning priority
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
図1は、例えばOCR処理された文書から、ユーザが指定した取得対象の情報のキーワードに対応した文字列を抽出して出力する情報処理装置10の機能構成例を示すブロック図である。
第1実施形態では、文書20に含まれる候補キーワードの組み合わせに基づいて、文書20に適合する優先情報30を選択する情報処理装置10について説明した。しかしながら、文書20には、文書20に含まれる候補キーワードの組み合わせは同じであるが、作成元や種類が異なる文書20が存在することがある。文書20の作成元や種類が異なれば、各々の文書20に含まれる候補キーワードの組み合わせは同じであっても、ユーザが所望する情報を表す目的キーワードが異なることがある。
11・・・スキャン処理部
12・・・画像処理部
12A・・・OCR処理部
12B・・・抽出部
12C・・・設定部
13・・・出力部
14・・・ユーザインターフェース部
15・・・制御部
16・・・キーワードDB
17・・・優先情報DB
20・・・文書
22・・・選択画面
24・・・ラジオボタン
26A(26B)・・・領域
30・・・優先情報
40・・・コンピュータ
41・・・CPU
42・・・ROM
43・・・RAM
44・・・不揮発性メモリ
46・・・バス
47・・・通信ユニット
48・・・入力ユニット
49・・・表示ユニット
50・・・スキャナユニット
Claims (10)
- 取得対象の情報を表す候補のキーワードが文書内に複数含まれる場合に、前記候補のキーワードのうち何れのキーワードを、前記取得対象となる情報の項目を表す目的のキーワードとして優先して使用するかを規定した優先情報に従って、前記候補のキーワードの中から前記目的のキーワードを設定する設定部と、
前記設定部で設定した前記目的のキーワードに対応した文字列を文書から抽出する抽出部と、
前記抽出部で抽出した前記目的のキーワードに対応した文字列を出力する出力部と、
を備えた情報処理装置。 - 文書が、異なる書式で記載された複数の文書で構成される場合、
前記設定部は、前記優先情報に従って、前記目的のキーワードを書式の異なる文書毎に設定する
請求項1記載の情報処理装置。 - 前記優先情報には文書毎の書式情報が対応付けられ、
前記設定部は、文書における書式が何れかの前記優先情報と対応付けられた特定の書式情報に従う場合、前記特定の書式情報が対応付けられた前記優先情報に従って、前記候補のキーワードの中から前記目的のキーワードを設定する
請求項2記載の情報処理装置。 - 前記優先情報と対応付けられた書式情報が、前記候補のキーワードを表す文字列の文字属性、または前記候補のキーワードに対応した文字列の文字属性で表された
請求項3記載の情報処理装置。 - 前記優先情報と対応付けられた書式情報が、文書における前記候補のキーワードの記載位置で表された
請求項3記載の情報処理装置。 - 前記優先情報と対応付けられた書式情報が、文書における前記候補のキーワードに対応した文字列の記載位置で表された
請求項3記載の情報処理装置。 - 前記候補のキーワードの記載位置、または前記候補のキーワードに対応した文字列の記載位置が、前記候補のキーワードの何れか1つの位置を基準とする相対位置で表された
請求項5または請求項6記載の情報処理装置。 - 前記候補のキーワードの中から何れか1つのキーワードを選択した選択結果を受け付ける受付部を備え、
前記設定部は、文書に含まれる前記候補のキーワードと一致する前記優先情報が存在しない場合、前記受付部で受け付けた選択結果によって表されるキーワードを、前記候補のキーワードにおける前記目的のキーワードに設定する
請求項1〜請求項7の何れか1項に記載の情報処理装置。 - 前記優先情報の何れとも一致しない前記候補のキーワードの各々に対して、前記選択結果に従った新たな優先情報を生成する生成部を備えた
請求項8記載の情報処理装置。 - コンピュータを、請求項1〜請求項9の何れか1項に記載の情報処理装置の各部として機能させるための情報処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019006192A JP7302175B2 (ja) | 2019-01-17 | 2019-01-17 | 情報処理装置、及び情報処理プログラム |
US16/531,119 US11006015B2 (en) | 2019-01-17 | 2019-08-04 | Information processing apparatus and non-transitory computer readable medium storing information processing program |
CN201910828110.XA CN111444751B (zh) | 2019-01-17 | 2019-09-03 | 信息处理装置、储存介质及信息处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019006192A JP7302175B2 (ja) | 2019-01-17 | 2019-01-17 | 情報処理装置、及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020115260A true JP2020115260A (ja) | 2020-07-30 |
JP7302175B2 JP7302175B2 (ja) | 2023-07-04 |
Family
ID=71609284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019006192A Active JP7302175B2 (ja) | 2019-01-17 | 2019-01-17 | 情報処理装置、及び情報処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11006015B2 (ja) |
JP (1) | JP7302175B2 (ja) |
CN (1) | CN111444751B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021064209A (ja) * | 2019-10-15 | 2021-04-22 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160292262A1 (en) * | 2015-04-02 | 2016-10-06 | Canon Information And Imaging Solutions, Inc. | System and method for extracting data from a non-structured document |
JP2018128996A (ja) * | 2017-02-10 | 2018-08-16 | キヤノン株式会社 | 情報処理装置、制御方法、およびプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3246432B2 (ja) * | 1998-02-10 | 2002-01-15 | 株式会社日立製作所 | 宛名読取り装置および郵便物等区分機 |
JP2007122403A (ja) * | 2005-10-28 | 2007-05-17 | Fuji Xerox Co Ltd | 文書タイトルおよび関連情報の自動抽出装置、抽出方法および抽出プログラム |
US20100076965A1 (en) * | 2006-11-20 | 2010-03-25 | Access Co., Ltd. | Information display device, information display program and information display system |
JP5295605B2 (ja) * | 2008-03-27 | 2013-09-18 | 株式会社東芝 | 検索キーワード改良装置、サーバ装置、および方法 |
US9886760B2 (en) * | 2015-03-05 | 2018-02-06 | Broncus Medical Inc. | GPU-based system for performing 2D-3D deformable registration of a body organ using multiple 2D fluoroscopic views |
JP6613620B2 (ja) * | 2015-05-20 | 2019-12-04 | 富士電機株式会社 | 対策事例情報登録・検索装置、キーワード決定方法 |
US10630639B2 (en) * | 2017-08-28 | 2020-04-21 | Go Daddy Operating Company, LLC | Suggesting a domain name from digital image metadata |
JP6760244B2 (ja) * | 2017-10-31 | 2020-09-23 | 京セラドキュメントソリューションズ株式会社 | 文書管理システム及び文書管理サーバー |
-
2019
- 2019-01-17 JP JP2019006192A patent/JP7302175B2/ja active Active
- 2019-08-04 US US16/531,119 patent/US11006015B2/en active Active
- 2019-09-03 CN CN201910828110.XA patent/CN111444751B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160292262A1 (en) * | 2015-04-02 | 2016-10-06 | Canon Information And Imaging Solutions, Inc. | System and method for extracting data from a non-structured document |
JP2018128996A (ja) * | 2017-02-10 | 2018-08-16 | キヤノン株式会社 | 情報処理装置、制御方法、およびプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021064209A (ja) * | 2019-10-15 | 2021-04-22 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
CN111444751B (zh) | 2024-01-05 |
CN111444751A (zh) | 2020-07-24 |
US20200236243A1 (en) | 2020-07-23 |
US11006015B2 (en) | 2021-05-11 |
JP7302175B2 (ja) | 2023-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009238217A (ja) | 情報処理システム、情報処理装置、情報処理方法およびプログラム | |
JP2010009509A (ja) | 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 | |
US9864750B2 (en) | Objectification with deep searchability | |
JP2020140450A (ja) | 構造化データ生成方法および構造化データ生成装置 | |
JP7302175B2 (ja) | 情報処理装置、及び情報処理プログラム | |
US20150356120A1 (en) | Design management apparatus, design management method, and non-transitory computer readable medium | |
JP7383882B2 (ja) | 情報処理装置、及び情報処理プログラム | |
JP5159588B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP2010039783A (ja) | 文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラム | |
US11074392B2 (en) | Information processing apparatus and non-transitory computer readable medium for switching between an attribute information mode and an image information mode | |
JP6330488B2 (ja) | 情報処理装置、記録システム、及びプログラム | |
JP2022019445A (ja) | 画像処理装置、方法、プログラム | |
WO2016170690A1 (ja) | 入力制御プログラム、入力制御装置、入力制御方法、文字修正プログラム、文字修正装置、及び文字修正方法 | |
US10755034B2 (en) | Information processing apparatus | |
JP5645481B2 (ja) | 装置、方法、及びプログラム | |
JP4999014B2 (ja) | 拡大縮小可能フォントをサポートするテキストエディタを用いたオブジェクトの挿入 | |
JP5811435B2 (ja) | 表示装置及び表示制御プログラム | |
JP6657799B2 (ja) | 図形処理装置、図形処理方法、および、図形処理プログラム | |
JP2020099030A (ja) | 情報処理装置、及び情報処理方法 | |
JP2013125450A (ja) | 外国人氏名正字出力システム及び外国人氏名正字出力方法 | |
CN117391045B (zh) | 可复制蒙文的可携带文件格式文件输出方法 | |
WO2021260852A1 (ja) | データ処理装置、データ処理方法、および、データ処理プログラム | |
JP2017204270A (ja) | 文字列領域・文字矩形抽出装置、文字列領域・文字矩形抽出方法、およびプログラム | |
JP5569367B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2018005367A (ja) | 編集支援システム、編集支援装置、データ置換装置及び編集支援方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230523 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230605 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7302175 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |