JP2019133370A - 画像処理装置および画像処理プログラム - Google Patents
画像処理装置および画像処理プログラム Download PDFInfo
- Publication number
- JP2019133370A JP2019133370A JP2018014374A JP2018014374A JP2019133370A JP 2019133370 A JP2019133370 A JP 2019133370A JP 2018014374 A JP2018014374 A JP 2018014374A JP 2018014374 A JP2018014374 A JP 2018014374A JP 2019133370 A JP2019133370 A JP 2019133370A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- issuer
- document
- image data
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 48
- 239000000284 extract Substances 0.000 claims abstract description 29
- 230000006870 function Effects 0.000 claims description 8
- 238000004321 preservation Methods 0.000 claims description 7
- 238000000034 method Methods 0.000 description 25
- 238000004891 communication Methods 0.000 description 12
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 230000015654 memory Effects 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/04—Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Character Input (AREA)
- Facsimiles In General (AREA)
Abstract
Description
図1は、本実施形態にかかる画像処理装置10の構成を簡易的に示している。画像処理装置10は、原稿を光学的に読み取って読取結果としての所定のフォーマットの画像データを生成し当該画像データを外部へ出力する読取装置(スキャナー30)と、通信可能に接続する。スキャナー30は、公知の製品を含めて画像読取装置として機能する装置であればよい。
図2は、制御部11がプログラムAに従って実行する処理をフローチャートにより示している。図2のフローチャートは、原稿の発行元を決定する処理を含んでいる。また、図2のフローチャートに従って説明する実施形態を、第1実施形態とも呼ぶ。
ステップS140では、発行元決定部21は、ステップS120で抽出した文字列を原稿の発行元に決定し、ステップS210へ進む。
ステップS200では、発行元決定部21は、ステップS150で抽出した文字列(第1文字列)を原稿の発行元に決定し、ステップS210へ進む。
図4は、制御部11がプログラムAに従って実行する処理であって図2とは異なる処理をフローチャートにより示している。図4のフローチャートは、原稿の発行元を決定する処理を含んでいる。また、図4のフローチャートに従って説明する実施形態を、第2実施形態とも呼ぶ。第2実施形態に関しては、既に説明した事項と共通する事項については説明を適宜省略する。
ステップS320では、発行元決定部21は、ステップS310において認識した文書画像データに含まれている文字列(データ内文字列)の中から、所定のキーワードと連続する文字列を抽出する。つまり、ステップS320は、図2のステップS120と同じ処理である。ただし第2実施形態では、ステップS320の処理を、原稿の発行元を抽出するための特定規則に基づいてデータ内文字列の中から前記発行元の候補としての第1文字列を抽出する処理と捉える。つまり、記憶部15に記憶されている規則データ16には、上述したような所定のキーワードが規定されているとともに、「所定のキーワードと連続する文字列」を抽出すべき旨が規定されている。
ステップS370では、表示制御部22は、原稿に関する種々の情報を設定するための設定画面を表示部12に表示させる。また、ステップS370では、表示制御部22は、ステップS360により決定された発行元を設定画面内に表示させる。
このように本実施形態によれば、画像処理装置10は、原稿の読み取りにより生成された文書画像データを取得し、文字認識により文書画像データに含まれている文字列(データ内文字列)を認識する制御部11と、原稿の発行元を抽出するための特定規則(特定規則を記述した規則データ16)を記憶する記憶部15と、を備える。そして、第1実施形態および第2実施形態を含んだ概念として、プログラムAを実行する制御部11は、特定規則に基づいて、データ内文字列の中から第1文字列を抽出し、更に、データ内文字列のうち第1文字列以外の部分から、第1文字列の少なくとも一部が一致する第2文字列を抽出し、第1文字列又は第2文字列を前記発行元に決定する。これにより、制御部11は、従来のような複雑なステップを必要とせず、また、第1文字列又は第2文字列の何れかから前記発行元を決定することができるため、原稿の発行元を正しく決定する可能性を高めることができる。
本実施形態は上述した内容に限定されず、後述するような種々の変形例を含む。各実施形態や各変形例を組み合わせた態様も本明細書による開示範囲に含まれる。
制御部11は、データ内文字列に含まれるURL情報を構成するドメイン名が示す地域名に対応した言語の文字認識を実行するとしてもよい。制御部11は、例えば、ステップS150において、URL情報からの第1文字列の抽出に伴い、URL情報のドメイン名の一部としての地域名を示す文字列「.jp」を認識したとする。この場合、ステップS170でデータ内文字列の第1文字列以外の部分から第1文字列の類似文字列(第2文字列)を抽出するときに、文字列「.jp」に対応する言語である日本語による文字認識処理をデータ内文字列に対して実行した上で、第1文字列の類似文字列の抽出を行う。
記憶部15は、文書画像データに対応付けられた発行元の保存回数を発行元毎に記録した保存回数情報を記憶しており、制御部11は、記憶部15に記憶された保存回数情報を参照し、第1文字列および第2文字列のうち保存回数が多い文字列を発行元に決定する、としてもよい。つまり、記憶部15は、ステップS220やステップS380で文書画像データとともに保存された発行元毎に、保存回数を記憶している。
図3や図5は、原稿の発行元の表示態様の一例を示しているに過ぎない。原稿の発行元をユーザーに提示するための画面のレイアウトやデザインや役割は様々である。
Claims (9)
- 原稿の読み取りにより生成された文書画像データを取得し、文字認識により前記文書画像データに含まれている文字列を認識する制御部と、
前記原稿の発行元を抽出するための特定規則を記憶する記憶部と、を備え、
前記制御部は、前記文書画像データに含まれている文字列の中から前記特定規則に基づいて第1文字列を抽出し、前記文書画像データに含まれている文字列のうち前記第1文字列以外の部分から前記第1文字列の少なくとも一部が一致する第2文字列を抽出し、前記第1文字列又は前記第2文字列を前記発行元に決定する、ことを特徴とする画像処理装置。 - 前記制御部は、前記特定規則に基づいて前記文書画像データに含まれている文字列の中のURL情報から前記第1文字列を抽出することを特徴とする請求項1に記載の画像処理装置。
- 前記制御部は、前記URL情報を構成するドメイン名が示す地域名に対応した言語の文字認識を実行した上で前記第2文字列を抽出することを特徴とする請求項2に記載の画像処理装置。
- 前記制御部は、前記文書画像データに含まれている文字列の中から、前記特定規則が定めるキーワードと連続する文字列を前記第1文字列として抽出することを特徴とする請求項1に記載の画像処理装置。
- 前記制御部は、前記第2文字列を抽出できた場合に、前記第2文字列を前記発行元に決定することを特徴とする請求項2または請求項3に記載の画像処理装置。
- 前記制御部は、前記第2文字列を抽出できなかった場合に、前記第1文字列を前記発行元に決定することを特徴とする請求項2、請求項3および請求項5のいずれかに記載の画像処理装置。
- 前記制御部は、前記第2文字列を抽出できた場合に、前記第1文字列を前記発行元に決定することを特徴とする請求項4に記載の画像処理装置。
- 前記記憶部は、前記文書画像データに対応付けられた前記発行元の保存回数を前記発行元毎に記録した保存回数情報を記憶しており、
前記制御部は、前記保存回数情報を参照し、前記第1文字列および前記第2文字列のうち前記保存回数が多い文字列を前記発行元に決定することを特徴とする請求項1〜請求項4のいずれかに記載の画像処理装置。 - 原稿の読み取りにより生成された文書画像データに対する処理をコンピューターに実行させる画像処理プログラムであって、
文字認識により前記文書画像データに含まれている文字列を認識する制御機能を実行させ、
前記制御機能は、前記文書画像データに含まれている文字列の中から前記原稿の発行元を抽出するための特定規則に基づいて第1文字列を抽出し、前記文書画像データに含まれている文字列のうち前記第1文字列以外の部分から前記第1文字列の少なくとも一部が一致する第2文字列を抽出し、前記第1文字列又は前記第2文字列を前記発行元に決定する、ことを特徴とする画像処理プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018014374A JP7032692B2 (ja) | 2018-01-31 | 2018-01-31 | 画像処理装置および画像処理プログラム |
CN201910084224.8A CN110097040B (zh) | 2018-01-31 | 2019-01-29 | 图像处理装置以及存储介质 |
US16/262,325 US10832081B2 (en) | 2018-01-31 | 2019-01-30 | Image processing apparatus and non-transitory computer-readable computer medium storing an image processing program |
EP19154903.9A EP3522035A1 (en) | 2018-01-31 | 2019-01-31 | Image processing apparatus and image processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018014374A JP7032692B2 (ja) | 2018-01-31 | 2018-01-31 | 画像処理装置および画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019133370A true JP2019133370A (ja) | 2019-08-08 |
JP7032692B2 JP7032692B2 (ja) | 2022-03-09 |
Family
ID=65276074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018014374A Active JP7032692B2 (ja) | 2018-01-31 | 2018-01-31 | 画像処理装置および画像処理プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US10832081B2 (ja) |
EP (1) | EP3522035A1 (ja) |
JP (1) | JP7032692B2 (ja) |
CN (1) | CN110097040B (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7528542B2 (ja) * | 2020-06-03 | 2024-08-06 | 株式会社リコー | 画像処理装置、方法およびプログラム |
JP7380653B2 (ja) * | 2021-05-31 | 2023-11-15 | 株式会社リコー | 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04256194A (ja) * | 1991-02-08 | 1992-09-10 | Fujitsu Ltd | 文字認識処理方式 |
JP2003015997A (ja) * | 2001-07-02 | 2003-01-17 | Ricoh Co Ltd | 通信装置 |
US20130204756A1 (en) * | 2012-02-06 | 2013-08-08 | Bill.Com, Inc. | Method and System for an Enhanced Business to Business Information and Money Exchange System |
JP2016189174A (ja) * | 2015-03-30 | 2016-11-04 | ブラザー工業株式会社 | 情報特定プログラム、及び情報特定方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3419425B2 (ja) * | 1995-09-29 | 2003-06-23 | 富士通株式会社 | 認識文字補正装置 |
JP2000341501A (ja) * | 1999-03-23 | 2000-12-08 | Minolta Co Ltd | 画像処理装置および画像処理方法、ならびに画像処理プログラムを記録した記録媒体 |
US7765271B1 (en) * | 2000-02-03 | 2010-07-27 | Hyland Software, Inc. | System and method for scanning a document in client/server environment |
JP2001306598A (ja) | 2000-04-20 | 2001-11-02 | Fuji Xerox Co Ltd | データ入力フォーム検索システム、データ入力フォーム検索方法、及び、コンピュータ読み取り可能な記録媒体 |
US7305129B2 (en) * | 2003-01-29 | 2007-12-04 | Microsoft Corporation | Methods and apparatus for populating electronic forms from scanned documents |
JP2005011260A (ja) * | 2003-06-20 | 2005-01-13 | Canon Sales Co Inc | 文書管理装置、文書管理システム及び文書管理用プログラム |
JP2005322060A (ja) * | 2004-05-10 | 2005-11-17 | Fuji Xerox Co Ltd | 文書画像処理装置および文書画像処理システム |
US7765481B2 (en) * | 2005-05-03 | 2010-07-27 | Mcafee, Inc. | Indicating website reputations during an electronic commerce transaction |
US7822620B2 (en) * | 2005-05-03 | 2010-10-26 | Mcafee, Inc. | Determining website reputations using automatic testing |
JP2007233913A (ja) * | 2006-03-03 | 2007-09-13 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
JP2008134683A (ja) * | 2006-11-27 | 2008-06-12 | Fuji Xerox Co Ltd | 画像処理装置および画像処理プログラム |
CN102024139A (zh) * | 2009-09-18 | 2011-04-20 | 富士通株式会社 | 字符串识别装置和方法 |
JP5733907B2 (ja) * | 2010-04-07 | 2015-06-10 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
US9026516B1 (en) * | 2011-08-09 | 2015-05-05 | Google Inc. | Interest-based keywords for prominent entity and by location |
CN104813271B (zh) * | 2012-12-28 | 2018-01-30 | 精工爱普生株式会社 | 数据变换系统、数据变换装置以及数据变换方法 |
JP6108927B2 (ja) * | 2013-04-16 | 2017-04-05 | 株式会社富士通マーケティング | 店舗別売上データ管理システム及び店舗別売上データ管理プログラム |
JP6098628B2 (ja) * | 2014-12-26 | 2017-03-22 | ブラザー工業株式会社 | 画像処理プログラム、画像処理方法、及び画像処理装置 |
CN104572627B (zh) * | 2015-01-30 | 2018-01-23 | 深圳市华傲数据技术有限公司 | 基于信息熵的对象名称编辑距离计算方法及匹配方法 |
JP6589302B2 (ja) * | 2015-03-10 | 2019-10-16 | ブラザー工業株式会社 | 情報処理装置,画像読取装置,および画像表示方法 |
-
2018
- 2018-01-31 JP JP2018014374A patent/JP7032692B2/ja active Active
-
2019
- 2019-01-29 CN CN201910084224.8A patent/CN110097040B/zh active Active
- 2019-01-30 US US16/262,325 patent/US10832081B2/en active Active
- 2019-01-31 EP EP19154903.9A patent/EP3522035A1/en not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04256194A (ja) * | 1991-02-08 | 1992-09-10 | Fujitsu Ltd | 文字認識処理方式 |
JP2003015997A (ja) * | 2001-07-02 | 2003-01-17 | Ricoh Co Ltd | 通信装置 |
US20130204756A1 (en) * | 2012-02-06 | 2013-08-08 | Bill.Com, Inc. | Method and System for an Enhanced Business to Business Information and Money Exchange System |
JP2016189174A (ja) * | 2015-03-30 | 2016-11-04 | ブラザー工業株式会社 | 情報特定プログラム、及び情報特定方法 |
Non-Patent Citations (2)
Title |
---|
HONGYE WANG: ""Document Logo Detection and Recognition Using Bayesian Model"", 2010 20TH INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION, JPN6021047514, 23 August 2010 (2010-08-23), US, pages 1961 - 1964, ISSN: 0004691292 * |
中野 正寛、外4名: ""情報信憑性判断のための自動要約に向けた人手による要約作成実験とその分析"", 情報処理学会研究報告, vol. 2008, no. 90, JPN6021047511, 17 September 2008 (2008-09-17), JP, pages 107 - 114, ISSN: 0004691291 * |
Also Published As
Publication number | Publication date |
---|---|
CN110097040B (zh) | 2023-07-04 |
US10832081B2 (en) | 2020-11-10 |
JP7032692B2 (ja) | 2022-03-09 |
US20190236398A1 (en) | 2019-08-01 |
CN110097040A (zh) | 2019-08-06 |
EP3522035A1 (en) | 2019-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109961069B (zh) | 图像处理装置以及存储介质 | |
JP5712487B2 (ja) | 画像処理装置、画像処理システム、画像処理方法、及びプログラム | |
US10528679B2 (en) | System and method for real time translation | |
JP7159608B2 (ja) | 操作画面の表示装置、画像処理装置及びプログラム | |
KR100740194B1 (ko) | 네트워크상의 이미지를 검색하여 인쇄하는 화상형성장치 및그 방법 | |
US20120072833A1 (en) | Host apparatus and screen capture control method thereof | |
US10481776B2 (en) | Server apparatus, client apparatus, information processing method, and storage medium | |
US9619440B2 (en) | Document conversion apparatus | |
US11749008B2 (en) | Image processing apparatus and image processing program | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
US10628386B2 (en) | Methods and systems to customize printable information | |
US10832081B2 (en) | Image processing apparatus and non-transitory computer-readable computer medium storing an image processing program | |
JP7081179B2 (ja) | 画像処理装置および画像処理プログラム | |
US11146705B2 (en) | Character recognition device, method of generating document file, and storage medium | |
JP6601143B2 (ja) | 印刷装置 | |
JP7404943B2 (ja) | 情報処理装置及び情報処理プログラム | |
US11481447B2 (en) | Information processing device and non-transitory computer readable medium | |
US11475687B2 (en) | Information processing system | |
US20140348430A1 (en) | Log-Image Extracting Apparatus for High Security | |
JP2024115025A (ja) | 画像処理装置、その制御方法、及びプログラム | |
JP2022139564A (ja) | 情報処理装置、情報処理装置の制御方法およびプログラム | |
JP2020021383A (ja) | プログラム、印刷データ処理システム | |
JP2007174079A (ja) | 履歴出力装置、履歴出力方法およびプログラム | |
JP2015022427A (ja) | 画像処理装置、画像処理システム及びプログラム | |
JP2014170317A (ja) | 画像編集装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201211 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7032692 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |