JP6935809B2 - 情報処理装置、およびプログラム - Google Patents
情報処理装置、およびプログラム Download PDFInfo
- Publication number
- JP6935809B2 JP6935809B2 JP2019046842A JP2019046842A JP6935809B2 JP 6935809 B2 JP6935809 B2 JP 6935809B2 JP 2019046842 A JP2019046842 A JP 2019046842A JP 2019046842 A JP2019046842 A JP 2019046842A JP 6935809 B2 JP6935809 B2 JP 6935809B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- file name
- read data
- character string
- changed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、広範囲の原稿をファイル名の生成対象とすることを目的とする。
(1)情報処理装置および機械学習装置の構成:
(2)機械学習処理:
(3)ファイル名生成処理:
(4)他の実施形態:
図1は、本発明の実施形態にかかる情報処理装置1を示すブロック図である。本実施形態にかかる情報処理装置1は、スキャナー2に接続されたコンピューターである。なお、本実施形態における情報処理装置1は、機械学習装置としても機能する。情報処理装置1は、プロセッサー10と、HDD(ハードディスクドライブ)等の記憶部20と、機器インターフェース30と、ディスプレイインターフェース40とを備えている。
次に、プロセッサー10が実行する機械学習処理を説明する。図2は機械学習処理を示すフローチャートである。機械学習処理は、読取データのファイル名を生成する前に予め少なくとも1回実行される。なお、機械学習処理が1回実行されていたとしても、教師データ20cが増加したら、再学習が行われる。再学習の開始タイミングは種々のタイイングであって良く、一定期間毎であっても良いし、任意の期間毎であっても良いし、利用者が指示したタイミングであっても良い。
次に、プロセッサー10が実行するファイル名生成処理を説明する。図5は、ファイル名生成処理を示すフローチャートである。学習済モデル20bが生成された後であれば実行可能である。従って、スキャナー2でスキャンが行われるたびに実行されてもよいし、利用者の指示によって実行されてもよく、種々のタイミングで実行されてよい。
以上の実施形態は本発明を実施するための一例であり、他にも種々の実施形態を採用可能である。例えば、本発明の一実施形態にかかる機械学習装置、情報処理装置は、読み取り以外の目的にも使用される電子機器、例えば複合機等に適用されていても良い。さらに、以上の実施形態のように読取データに基づいて、ファイル名を生成する手法は、プログラムの発明、方法の発明としても実現可能である。
Claims (7)
- スキャナーで読み取られた原稿の読取データに含まれている画像、文字列、前記読取デ
ータのレイアウト、のうちの少なくとも1つと、前記読取データのファイル名とを対応付
けた教師データを用いて機械学習した学習済モデルを記憶する記憶部と、
前記読取データに含まれている画像、文字列、前記読取データのレイアウト、のうちの
少なくとも1つと、前記学習済モデルとを用いて、前記読取データのファイル名を生成す
る制御部と、
を備え、
前記制御部が生成した前記ファイル名が変更されなかった場合、
前記読取データに含まれている画像、文字列、前記読取データのレイアウト、のうちの
少なくとも1つと、前記制御部が生成した前記ファイル名とを対応づけたデータを教師データに追加し、
前記制御部が生成した前記ファイル名が変更された場合、
前記読取データに含まれている画像、文字列、前記読取データのレイアウト、のうちの
少なくとも1つと、変更後の前記ファイル名とを対応づけたデータを、前記ファイル名が変更されなかった場合よりも水増しして前記教師データに追加し、データ追加後の前記教師データを用いて前記学習済モデルを再学習させる学習部と、
を備える情報処理装置。 - 前記学習部は、
前記制御部が生成した前記ファイル名に含まれる文字列が変更された場合、
前記読取データに含まれている画像、文字列、前記読取データのレイアウト、のうちの
少なくとも1つと、変更された文字列を含む変更後のファイル名とを対応付けたデータを、前記ファイル名が変更されなかった場合よりも水増しして前記教師データに追加し、データ追加後の前記教師データを用いて前記学習済モデルを再学習させる、
請求項1に記載の情報処理装置。 - 前記ファイル名は、
前記読取データに含まれる日付情報を有する、
請求項1〜請求項2のいずれかに記載の情報処理装置。 - 前記学習済モデルは、
前記ファイル名に前記日付情報が含まれるか否かを出力する、
請求項3に記載の情報処理装置。 - 前記教師データが示す前記ファイル名は、
利用者によって入力された文字列と、前記読取データに対するOCR処理によって読
み取られた文字列との少なくとも一方を含む、
請求項1〜請求項4のいずれかに記載の情報処理装置。 - 前記画像は、前記原稿の発行元を示す画像を含み、
前記制御部は、前記発行元を示す画像を基に前記原稿の前記発行元を特定し、前記発行
元の名称を含む前記ファイル名を生成する、
請求項1〜請求項5のいずれかに記載の情報処理装置。 - 情報処理装置を、
スキャナーで読み取られた原稿の読取データに含まれている画像、文字列、前記読取デ
ータのレイアウト、のうちの少なくとも1つと、前記読取データのファイル名とを対応付
けた教師データを用いて機械学習した学習済モデルを記憶する記憶部、
前記読取データに含まれている画像、文字列、前記読取データのレイアウト、のうちの
少なくとも1つと、前記学習済モデルとを用いて、前記読取データのファイル名を生成す
る制御部、
前記制御部が生成した前記ファイル名が変更されなかった場合、
前記読取データに含まれている画像、文字列、前記読取データのレイアウト、のうちの
少なくとも1つと、前記制御部が生成した前記ファイル名とを対応づけたデータを教師データに追加し、
前記制御部が生成した前記ファイル名が変更された場合、
前記読取データに含まれている画像、文字列、前記読取データのレイアウト、のうちの
少なくとも1つと、変更後の前記ファイル名とを対応づけたデータを、前記ファイル名が変更されなかった場合よりも水増しして前記教師データに追加し、データ追加後の前記教師データを用いて前記学習済モデルを再学習させる学習部、
として機能させるプログラム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019046842A JP6935809B2 (ja) | 2019-03-14 | 2019-03-14 | 情報処理装置、およびプログラム |
| CN202010169601.0A CN111695568B (zh) | 2019-03-14 | 2020-03-12 | 信息处理装置、机器学习装置以及信息处理方法 |
| US16/818,066 US11335107B2 (en) | 2019-03-14 | 2020-03-13 | Generating file name using machine-learned model that relearns |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019046842A JP6935809B2 (ja) | 2019-03-14 | 2019-03-14 | 情報処理装置、およびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020149409A JP2020149409A (ja) | 2020-09-17 |
| JP6935809B2 true JP6935809B2 (ja) | 2021-09-15 |
Family
ID=72423803
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019046842A Active JP6935809B2 (ja) | 2019-03-14 | 2019-03-14 | 情報処理装置、およびプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US11335107B2 (ja) |
| JP (1) | JP6935809B2 (ja) |
| CN (1) | CN111695568B (ja) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6881991B2 (ja) * | 2017-01-30 | 2021-06-02 | キヤノン株式会社 | 画像処理装置、及びその制御方法とプログラム |
| JP7036082B2 (ja) * | 2019-04-04 | 2022-03-15 | セイコーエプソン株式会社 | 画像処理装置、機械学習装置、画像処理方法 |
| JP7391672B2 (ja) * | 2020-01-21 | 2023-12-05 | キヤノン株式会社 | 文書を電子化するための画像処理システム、その制御方法及びプログラム |
| JP7696730B2 (ja) * | 2021-03-09 | 2025-06-23 | キヤノン株式会社 | 情報処理装置、情報処理方法、およびプログラム |
| US20230062307A1 (en) * | 2021-08-17 | 2023-03-02 | Sap Se | Smart document management |
| US20250139932A1 (en) * | 2023-10-25 | 2025-05-01 | Hewlett Packard Enterprise Development Lp | Image feature extraction using entropy-based analysis |
| US12555400B2 (en) * | 2024-01-05 | 2026-02-17 | Sunia Pte. Ltd. | Online handwriting document layout analysis system |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008071050A (ja) | 2006-09-13 | 2008-03-27 | Sharp Corp | 情報処理端末装置、情報処理装置、ファイル管理サーバ、情報処理システム、ファイル名自動生成方法、プログラムおよび記録媒体 |
| JP2008250651A (ja) * | 2007-03-30 | 2008-10-16 | National Institute Of Information & Communication Technology | 情報処理装置、情報処理方法、およびプログラム |
| JP4359721B2 (ja) * | 2007-04-06 | 2009-11-04 | シャープ株式会社 | 画像処理システム、画像処理方法、及びプログラム |
| JP2009205325A (ja) * | 2008-02-27 | 2009-09-10 | Seiko Epson Corp | ファイル生成装置、ファイル生成方法およびファイル生成プログラム |
| JP2016143354A (ja) * | 2015-02-04 | 2016-08-08 | エヌ・ティ・ティ・コムウェア株式会社 | 学習装置、学習方法、およびプログラム |
| JP6613687B2 (ja) * | 2015-07-30 | 2019-12-04 | 株式会社リコー | 画像処理装置、画像処理方法及びプログラム |
| JP2017146745A (ja) * | 2016-02-16 | 2017-08-24 | キヤノン株式会社 | 情報処理装置、制御方法、情報処理システム、およびプログラム |
| JP6629678B2 (ja) * | 2016-06-16 | 2020-01-15 | 株式会社日立製作所 | 機械学習装置 |
| JP6881990B2 (ja) * | 2017-01-30 | 2021-06-02 | キヤノン株式会社 | 画像処理装置とその制御方法、及びプログラム |
| JP6897357B2 (ja) * | 2017-06-16 | 2021-06-30 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
| US10140553B1 (en) * | 2018-03-08 | 2018-11-27 | Capital One Services, Llc | Machine learning artificial intelligence system for identifying vehicles |
| CN109063105A (zh) * | 2018-07-27 | 2018-12-21 | 北京字节跳动网络技术有限公司 | 文件存储方法、装置、计算机设备和存储介质 |
-
2019
- 2019-03-14 JP JP2019046842A patent/JP6935809B2/ja active Active
-
2020
- 2020-03-12 CN CN202010169601.0A patent/CN111695568B/zh active Active
- 2020-03-13 US US16/818,066 patent/US11335107B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| CN111695568B (zh) | 2023-08-18 |
| US20200293810A1 (en) | 2020-09-17 |
| JP2020149409A (ja) | 2020-09-17 |
| US11335107B2 (en) | 2022-05-17 |
| CN111695568A (zh) | 2020-09-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6935809B2 (ja) | 情報処理装置、およびプログラム | |
| CN110210542B (zh) | 图片文字识别模型训练方法、装置及文字识别系统 | |
| JP4859025B2 (ja) | 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体 | |
| JP3747589B2 (ja) | 画像特徴量比較装置および画像特徴量比較プログラムを記録した記録媒体 | |
| US7486807B2 (en) | Image retrieving device, method for adding keywords in image retrieving device, and computer program therefor | |
| US12254170B2 (en) | Utilizing a transformer-based generative language model to generate digital design document variations | |
| CN115131804B (zh) | 文档识别方法、装置、电子设备和计算机可读存储介质 | |
| KR20240111058A (ko) | 이미지 생성을 위한 프롬프트 생성 장치 및 방법 | |
| CN110473162B (zh) | 机器学习装置、摄影时间估计装置及学习模型的生成方法 | |
| TW202226111A (zh) | 學習裝置、程式產品及學習方法 | |
| KR102569165B1 (ko) | 사용자 트렌드에 기초한 사진 인화 서비스 제공 방법 및 장치 | |
| CN111126273A (zh) | 图像处理方法、装置、电子设备以及存储介质 | |
| JP2004192555A (ja) | 情報管理方法、情報管理装置及び情報管理プログラム | |
| JP7095389B2 (ja) | 画像処理装置、画像処理プログラムおよび写真データの生産方法 | |
| JP2001195579A (ja) | 画像評価装置 | |
| CN109492023B (zh) | 一种汽车信息处理方法及其设备、计算机存储介质 | |
| CN118365972A (zh) | 物品图像生成方法、装置、电子设备与存储介质 | |
| KR102684423B1 (ko) | 데이터 검색 방법 및 시스템 | |
| JP2021033743A (ja) | 情報処理装置、文書識別方法、及び情報処理システム | |
| JP2017027489A (ja) | 情報処理装置及びプログラム | |
| JP2020047138A (ja) | 情報処理装置 | |
| JPH11238077A (ja) | 画像検索装置及び方法並びに画像検索プログラムを記録する記録媒体 | |
| JP7470279B2 (ja) | 情報処理装置、画像出力プログラム、及び画像出力方法 | |
| JP2021093093A (ja) | 電子アルバム生成装置、電子アルバム生成方法及びプログラム | |
| JP2013254393A (ja) | データ処理装置及びこれを用いたデータ処理方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200609 |
|
| RD07 | Notification of extinguishment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7427 Effective date: 20200811 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210420 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210518 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210714 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210727 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210809 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6935809 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |