JP7400397B2 - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP7400397B2 JP7400397B2 JP2019213575A JP2019213575A JP7400397B2 JP 7400397 B2 JP7400397 B2 JP 7400397B2 JP 2019213575 A JP2019213575 A JP 2019213575A JP 2019213575 A JP2019213575 A JP 2019213575A JP 7400397 B2 JP7400397 B2 JP 7400397B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- name
- control unit
- character
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 9
- 238000000034 method Methods 0.000 description 94
- 238000012545 processing Methods 0.000 description 56
- 238000000605 extraction Methods 0.000 description 33
- 238000010586 diagram Methods 0.000 description 24
- 230000006870 function Effects 0.000 description 22
- 238000012015 optical character recognition Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 10
- 230000009182 swimming Effects 0.000 description 7
- CCEKAJIANROZEO-UHFFFAOYSA-N sulfluramid Chemical group CCNS(=O)(=O)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)F CCEKAJIANROZEO-UHFFFAOYSA-N 0.000 description 6
- 235000010724 Wisteria floribunda Nutrition 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 239000011521 glass Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000007723 transport mechanism Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
図3A及び図3Bは、ファイル名生成処理を示すフローチャートである。以下、図3A及び図3B等を参照して、本実施形態に係る画像形成装置1の動作について説明する。なお、以下の説明において、画像形成装置1は、電源が投入されている状態であるものとする。
(1-1)原稿画像が画像部分を1つのみ含む場合
図5は、原稿画像の一例を示す図である。図5を参照して、原稿画像50は、海で泳いでいる人間の写真に対応している画像部分51のみを含み、文字部分を含まない。
(1-2-1)分類名が複数の画像部分に共通している場合
図6は、原稿画像の他の一例を示す図である。図6を参照して、原稿画像60は、港の写真に対応している画像部分61と、海辺の写真に対応している画像部分62と、を含み、文字部分を含まない。
図7は、原稿画像の他の一例を示す図である。図7を参照して、原稿画像70は、山の写真に対応している画像部分71と、海辺の写真に対応している画像部分72と、を含み、文字部分を含まない。
(2-1)原稿画像が文字部分を1つのみ含む場合
図8は、原稿画像の他の一例を示す図である。図8を参照して、原稿画像80は、水泳についての説明を示している文字列81Aを含む文字部分81のみを含み、画像部分を含まない。
(2-2-1)分類名が複数の文字部分に共通している場合
図9は、原稿画像の他の一例を示す図である。図9を参照して、原稿画像90は、海の大きさについての説明を示している文字列91Aを含む文字部分91と、海の役割についての説明を示している文字列92Aを含む文字部分92と、を含み、画像部分を含まない。
図10は、原稿画像の他の一例を示す図である。図10を参照して、原稿画像101は、海の大きさについての説明を示している文字列102Aを含む文字部分102と、富士山についての説明を示している文字列103Aを含む文字部分103と、を含み、画像部分を含まない。
(3-1)文字部分のサイズが画像部分のサイズよりも大きい場合
(3-1-1)原稿画像が文字部分と画像部分とを1つずつ含む場合
図11は、原稿画像の他の一例を示す図である。図11を参照して、原稿画像110は、海の大きさについての説明を示している文字列111Aを含む文字部分111と、海辺の写真に対応している画像部分112と、を含む。
図12は、原稿画像の他の一例を示す図である。図12を参照して、原稿画像120は、富士山についての説明を示している文字列121Aを含む文字部分121と、海の大きさについての説明を示している文字列122Aを含む文字部分122と、を含む。原稿画像120はまた、山の写真に対応している画像部分123と、海辺の写真に対応している画像部分124と、を含む。
(3-2-1)原稿画像が文字部分と画像部分とを1つずつ含む場合
図13は、原稿画像の他の一例を示す図である。原稿画像130は、海の大きさについての説明を示す文字列131Aを含む文字部分131と、海辺の写真に対応している画像部分132と、を含む。
図14は、原稿画像の他の一例を示す図である。図14を参照して、原稿画像140は、富士山についての説明を示している文字列141Aを含む文字部分141と、海の大きさについての説明を示している文字列142Aを含む文字部分142と、を含む。原稿画像140はまた、山の写真に対応している画像部分143と、海辺の写真に対応している画像部分144とを含む。
図15は、原稿画像の他の一例を示す図である。図15を参照して、原稿画像150は、海の大きさについての説明を示している文字列151Aを含む文字部分151と、海辺の写真に対応している画像部分152と、を含む。
上記実施形態では、制御部10は、OCR処理の結果に基づいて原稿画像が文字部分を含むか否かを判定し、画像部分抽出処理の結果に基づいて原稿画像が画像部分を含むか否かを判定したが、本発明はそのような実施形態に限定されない。第1の変形例では、制御部10は、HDD17に予め記憶されているテンプレート画像を用いたテンプレートマッチングを行なうことにより、上記2つの判定を行なう。
上記実施形態では、制御部10は、分類名を主題として取得したが、本発明はそのような実施形態に限定されない。制御部10は、主題として、画像部分の内容又は文字部分の内容を適切に示す、例えば題名等の名称を取得してもよい。
10 制御部
11 画像読取部
17 HDD
22 通信部
Claims (4)
- 入力された画像の特徴に応じた名称を出力するための学習が予め行なわれた第1学習モデルと、入力された文字列に応じた名称を出力するための学習が予め行なわれた第2学習モデルと、を予め記憶する記憶部と、
画像ファイルが入力される画像入力部と、
前記画像入力部を介して入力された前記画像ファイルが示す画像に応じた主題を取得し、取得された前記主題を含むファイル名を、前記画像ファイルのファイル名として生成する制御部と、を備え、
前記制御部は、前記画像ファイルが示す画像が、予め定められた特徴を含む画像部分を含み、かつ、文字部分を含まない場合に、前記第1学習モデルを用いて、前記画像部分の前記特徴に応じた名称を主題として取得し、
前記画像ファイルが示す画像が、前記文字部分を含み、かつ、前記画像部分を含まない場合に、前記第2学習モデルを用いて、前記文字部分に含まれる文字列に応じた名称を前記主題として取得し、
更に、前記制御部は、
前記画像ファイルが示す画像が前記文字部分と前記画像部分とを含む場合であって、前記文字部分のサイズが前記画像部分のサイズよりも大きく、かつ、前記文字部分のサイズと前記画像部分のサイズとの差を示す値が予め定められた値を超えている場合には、前記第2学習モデルを用いて、前記文字部分に含まれる前記文字列に応じた名称を前記主題として取得し、
前記画像ファイルが示す画像が前記文字部分と前記画像部分とを含む場合であって、前記画像部分のサイズが前記文字部分のサイズよりも大きく、かつ、前記画像部分のサイズと前記文字部分のサイズとの差を示す値が予め定められた値を超えている場合には、前記第1学習モデルを用いて、前記画像部分の前記特徴に応じた名称を前記主題として取得する、情報処理装置。 - 入力された画像の特徴に応じた名称を出力するための学習が予め行なわれた第1学習モデルと、入力された文字列に応じた名称を出力するための学習が予め行なわれた第2学習モデルと、を予め記憶する記憶部と、
画像ファイルが入力される画像入力部と、
前記画像入力部を介して入力された前記画像ファイルが示す画像に応じた主題を取得し、取得された前記主題を含むファイル名を、前記画像ファイルのファイル名として生成する制御部と、を備え、
前記制御部は、前記画像ファイルが示す画像が、予め定められた特徴を含む画像部分を含み、かつ、文字部分を含まない場合に、前記第1学習モデルを用いて、前記画像部分の前記特徴に応じた名称を主題として取得し、
前記画像ファイルが示す画像が、前記文字部分を含み、かつ、前記画像部分を含まない場合に、前記第2学習モデルを用いて、前記文字部分に含まれる文字列に応じた名称を前記主題として取得し、
更に、前記制御部は、前記画像ファイルが示す画像が前記文字部分と前記画像部分とを含む場合であって、前記文字部分のサイズと前記画像部分のサイズとの差を示す値が予め定められた値以下である場合には、前記第2学習モデルを用いて、前記文字部分に含まれる前記文字列に応じた名称を前記主題として取得する、情報処理装置。 - 入力された画像の特徴に応じた名称を出力するための学習が予め行なわれた第1学習モデルと、入力された文字列に応じた名称を出力するための学習が予め行なわれた第2学習モデルと、を予め記憶する記憶部と、
画像ファイルが入力される画像入力部と、
前記画像入力部を介して入力された前記画像ファイルが示す画像に応じた主題を取得し、取得された前記主題を含むファイル名を、前記画像ファイルのファイル名として生成する制御部と、を備え、
前記制御部は、前記画像ファイルが示す画像が、予め定められた特徴を含む画像部分を含み、かつ、文字部分を含まない場合に、前記第1学習モデルを用いて、前記画像部分の前記特徴に応じた名称を主題として取得し、
更に、前記制御部は、
前記画像ファイルが示す画像が複数の画像部分を含む場合であって、取得された前記名称が前記複数の画像部分に共通している場合には、共通している前記名称を前記主題として取得し、
前記画像ファイルが示す画像が複数の画像部分を含む場合であって、取得された前記名称が前記複数の画像部分に共通していない場合には、共通していない前記名称を全て含む文字列を、前記主題として取得する、記載の情報処理装置。 - 入力された画像の特徴に応じた名称を出力するための学習が予め行なわれた第1学習モデルと、入力された文字列に応じた名称を出力するための学習が予め行なわれた第2学習モデルと、を予め記憶する記憶部と、
画像ファイルが入力される画像入力部と、
前記画像入力部を介して入力された前記画像ファイルが示す画像に応じた主題を取得し、取得された前記主題を含むファイル名を、前記画像ファイルのファイル名として生成する制御部と、を備え、
前記制御部は、前記画像ファイルが示す画像が、予め定められた特徴を含む画像部分を含み、かつ、文字部分を含まない場合に、前記第1学習モデルを用いて、前記画像部分の前記特徴に応じた名称を主題として取得し、
更に、前記制御部は、
前記画像ファイルが示す画像が複数の文字部分を含む場合であって、取得された前記名称が前記複数の文字部分に共通している場合には、共通している前記名称を前記主題として取得し、
前記画像ファイルが示す画像が複数の文字部分を含む場合であって、取得された前記名称が前記複数の文字部分に共通していない場合には、共通していない前記名称を全て含む文字列を、前記主題として取得する、情報処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019213575A JP7400397B2 (ja) | 2019-11-26 | 2019-11-26 | 情報処理装置 |
US17/105,595 US11587303B2 (en) | 2019-11-26 | 2020-11-26 | Information processing apparatus that generates file names of image files |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019213575A JP7400397B2 (ja) | 2019-11-26 | 2019-11-26 | 情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021087072A JP2021087072A (ja) | 2021-06-03 |
JP7400397B2 true JP7400397B2 (ja) | 2023-12-19 |
Family
ID=75974250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019213575A Active JP7400397B2 (ja) | 2019-11-26 | 2019-11-26 | 情報処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11587303B2 (ja) |
JP (1) | JP7400397B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008538148A (ja) | 2005-02-18 | 2008-10-09 | イーストマン コダック カンパニー | デジタイズされたハードコピー・メディア・コレクションの自動整理 |
JP2018124656A (ja) | 2017-01-30 | 2018-08-09 | キヤノン株式会社 | 画像処理装置とその制御方法、及びプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI116547B (fi) * | 2003-09-04 | 2005-12-15 | Nokia Corp | Menetelmä ja laitteisto matkaviestimeen tallennettavien kuvien nimeämiseksi |
JP4134056B2 (ja) | 2005-01-27 | 2008-08-13 | 京セラミタ株式会社 | 画像読取り装置および画像読取りプログラム |
JP2011155548A (ja) | 2010-01-28 | 2011-08-11 | Kyocera Mita Corp | ファイル作成装置、ファイル作成プログラム、及びファイル作成方法 |
JP7043929B2 (ja) * | 2018-03-29 | 2022-03-30 | 株式会社リコー | 情報処理システムおよび情報処理方法 |
-
2019
- 2019-11-26 JP JP2019213575A patent/JP7400397B2/ja active Active
-
2020
- 2020-11-26 US US17/105,595 patent/US11587303B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008538148A (ja) | 2005-02-18 | 2008-10-09 | イーストマン コダック カンパニー | デジタイズされたハードコピー・メディア・コレクションの自動整理 |
JP2018124656A (ja) | 2017-01-30 | 2018-08-09 | キヤノン株式会社 | 画像処理装置とその制御方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021087072A (ja) | 2021-06-03 |
US11587303B2 (en) | 2023-02-21 |
US20210158070A1 (en) | 2021-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4789516B2 (ja) | 文書変換装置、文書変換方法並びに記憶媒体 | |
JP5173721B2 (ja) | 文書処理システム及びその制御方法、プログラム、記憶媒体 | |
JP4756930B2 (ja) | ドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置 | |
US7911635B2 (en) | Method and apparatus for automated download and printing of Web pages | |
US9250834B2 (en) | Method and apparatus for reading and replacing control and/or identification data in a print image to support document tracking, flow control, and security | |
US20080115080A1 (en) | Device, method, and computer program product for information retrieval | |
JP4836260B2 (ja) | 画像形成装置、画像形成方法、記録媒体及びプログラム | |
JP2006085298A (ja) | 画像処理装置、画像処理方法 | |
US20090303508A1 (en) | Image reading apparatus and image forming apparatus | |
JP2009169536A (ja) | 情報処理装置、画像形成装置、ドキュメント生成方法、ドキュメント生成プログラム | |
US10863043B2 (en) | Image forming apparatus for forming image on recording sheet | |
US8934147B2 (en) | Digitizing apparatus for generating portable data file by compiling image data of pages into single file, having page number conversion unit for converting page numbers into electronic document page numbers | |
US20080239330A1 (en) | Image processing apparatus, image forming apparatus and computer-readable medium | |
JP5880052B2 (ja) | 文書処理装置及びプログラム | |
JP7400397B2 (ja) | 情報処理装置 | |
JP2006093917A (ja) | 画像読取装置および画像処理装置、画像形成装置 | |
JP2023164539A (ja) | 画像処理装置、その制御方法及びプログラム | |
JP2007280223A (ja) | 画像形成装置及び情報処理方法 | |
US10915800B2 (en) | Image forming apparatus that acquires fixed data and plurality of pieces of variable data according to user's instruction, and executes variable printing | |
JP2013251610A (ja) | 文書処理装置及びプログラム | |
US10198222B2 (en) | Information display system | |
JP2014211884A (ja) | 文書処理システムおよび文書処理システムの制御方法 | |
JP2020119255A (ja) | 画像変換システムおよび情報処理装置 | |
US11849086B2 (en) | Image processing apparatus capable of extracting portion of document image specified by preset index and subjecting character string in extracted portion to processing associated with index | |
US11825041B2 (en) | Image processing apparatus and image forming apparatus capable of classifying respective images of plurality of pages of original document based on plurality of topic words |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20220930 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221028 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230728 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231120 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7400397 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |