CN109934244B - 格式类别学习系统以及图像处理装置 - Google Patents
格式类别学习系统以及图像处理装置 Download PDFInfo
- Publication number
- CN109934244B CN109934244B CN201810714643.0A CN201810714643A CN109934244B CN 109934244 B CN109934244 B CN 109934244B CN 201810714643 A CN201810714643 A CN 201810714643A CN 109934244 B CN109934244 B CN 109934244B
- Authority
- CN
- China
- Prior art keywords
- image
- format
- original document
- machine learning
- document image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 43
- 238000010801 machine learning Methods 0.000 claims abstract description 76
- 230000009467 reduction Effects 0.000 claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 9
- 238000004891 communication Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000003467 diminishing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19147—Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
- Character Input (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明提供格式类别学习系统以及图像处理装置。格式类别学习系统包括原始文件图像获取部、图像缩小部、噪声附加部、标签附加部及机器学习处理部。原始文件图像获取部获取已记入格式的图像作为原始文件图像。图像缩小部缩小原始文件图像。噪声附加部向由图像缩小部缩小之前的原始文件图像或由图像缩小部缩小之后的原始文件图像附加噪声,并生成多个机器学习用图像。标签附加部将原始文件图像的格式类别作为标签而与多个机器学习用图像相关联。机器学习处理部将多个机器学习用图像及标签设为训练数据而执行分类器的机器学习,所述分类器将已记入格式的图像作为输入并将格式类别作为输出。本发明能够无需使用格式布局信息就能够准确地进行格式分类。
Description
技术领域
本发明涉及格式类别学习系统以及图像处理装置。
背景技术
在某文件管理系统中,确定由数码复合机扫描的文件的格式,并且在与格式对应的文件夹中保存该文件。另外,在该文件管理系统中,基于表示格式内的框/表的位置以及大小、格式内的文字等的格式布局信息,来识别格式。
发明内容
本发明涉及的格式类别学习系统具备原始文件图像获取部、图像缩小部、噪声附加部、标签附加部以及机器学习处理部。原始文件图像获取部获取已记入格式的图像作为原始文件图像。图像缩小部缩小所述原始文件图像。噪声附加部向对由所述图像缩小部缩小之前的所述原始文件图像或者由所述图像缩小部缩小之后的所述原始文件图像附加噪声,来生成多个机器学习用图像。标签附加部将所述原始文件图像的格式类别作为标签而与所述多个机器学习用图像相关联。机器学习处理部将所述多个机器学习用图像以及所述标签作为训练数据而执行分类器的机器学习,所述分类器将已记入格式的图像作为输入,将格式类别作为输出。
附图说明
图1示出本发明的实施方式涉及的格式类别学习系统的结构;
图2示出在图1中的分类器27的机器学习中使用的已记入格式的一个例子;
图3示出与图2所示的已记入格式对应的机器学习用图像的一个例子;
图4说明图1所示的格式类别学习系统中的格式类别的机器学习。
具体实施方式
以下,基于附图,对本发明的实施方式进行说明。
图1是示出本发明的实施方式涉及的格式类别学习系统的结构的框图。在图1所示的系统中,图像处理装置1经由网络2而与服务器装置3之间进行通信。
图1中的图像处理装置1例如为数码复合机等图像形成装置,包括图像读取装置11、输入装置12、显示装置13、存储装置14、通信装置15以及运算处理装置16。
图像读取装置11以光学方式读取文件(这里是已记入的格式)的图像,并生成该图像的图像数据。
输入装置12是检测用户操作并输出表示用户操作的信息的硬键、触控面板等装置。显示装置13是向用户显示各种信息的液晶显示器等装置。例如,输入装置12以及显示装置13被配置在操作面板上,该操作面板设置于框体的表面上。
存储装置14是硬盘、闪存等非易失性的存储装置。
通信装置15是与网络2连接、且在与其他装置(服务器装置3等)之间进行数据通信的网络接口等装置。
运算处理装置16包括执行各种程序的计算机、ASIC(Application SpecificIntegrated Circuit,专用集成电路)等,通过计算机、ASIC等,作为各种处理部而工作。
这里,为了格式类别的机器学习,运算处理装置16作为原始文件图像获取部21、图像缩小部22、噪声附加部23以及标签附加部24而工作。另外,为了格式的分类,运算处理装置16作为格式图像获取部25、图像缩小部26、分类器27、格式处理部28以及参数设定部29而工作。
原始文件图像获取部21获取在分类器27的机器学习中使用的已记入格式的图像来作为原始文件图像。在该实施方式中,原始文件图像获取部21使用图像读取装置11而获取从已记入格式中读取的格式图像。
图2是示出在图1中的分类器27的机器学习中使用的已记入格式的一个例子的图。
图像缩小部22缩小该原始文件图像。即,图像缩小部22对原始文件图像进行分辨率转换。此外,图像缩小部22缩小原始文件图像,以使缩小后的原始文件图像的大小(纵横的像素数)变成预定值(例如,纵向100像素,横向00像素)。
噪声附加部23对由图像缩小部22缩小之前的原始文件图像或者由图像缩小部缩小之后的原始文件图像(这里是缩小后的原始文件图像)附加噪声,并生成多个机器学习用图像。
噪声附加部23通过以彼此不同的位置模式附加噪声,来生成彼此不同的多个机器学习用图像。例如,噪声附加部23随机确定预定数量的噪声的附加位置,并向这些附加位置附加噪声。
或者,噪声附加部23对缩小前的原始文件图像以彼此不同的模式配置噪声并生成多个中间图像,并分别缩小多个中间图像,由此生成彼此不同的多个机器学习用图像。
并且,在该实施方式中,噪声附加部23将伪字符图像附加到原始文件图像来作为上述噪声,并生成多个机器学习用图像。该伪字符图像不是文字图像,而是预定形状且预定大小的图像。例如,将固定浓度的矩形形状的图像设为伪字符图像。
这里,在向由图像缩小部22缩小之前的原始文件图像附加噪声的情况下,“预定大小”是在缩小前的原始文件图像内可能使用的文字的从最小大小到最大大小中的任意大小。另一方面,在向由图像缩小部22缩小之后的原始文件图像附加噪声的情况下,“预定大小”是在原始文件图像内能够使用的缩小后的文字的从最小大小到最大大小为止的任意大小。例如,“预定大小”被设定为(缩小前或者缩小后的)原始文件图像的大小的1~10%的范围内的任意值。
另外,噪声附加部23在应当附加上述噪声的位置(以下,称为附加位置)的浓度与背景浓度(例如,白色)不同的情况下,可以将附加位置变更为具有背景浓度的其他位置。该其他位置例如再次被随机选择。
图3是示出与图2所示的已记入格式对应的机器学习用图像的一个例子的图。例如,如图3所示,多个伪字符图像作为噪声而被附加到随机的位置。
并且,噪声附加部23可以以彼此不同的纵横比向多个附加位置附加伪字符图像。
并且,噪声附加部23可以检测原始文件图像内的框,并向所检测出的框的内部附加伪字符图像。此外,框能够通过现有的方法(边缘提取、模式匹配等)来检测出。
标签附加部24将原始文件图像的格式类别作为标签而与所生成的多个机器学习用图像相关联,并生成包含多个机器学习用图像和格式类别在内的机器学习用的训练数据。
例如,标签附加部24按照通过输入装置12所检测出的用户操作,将原始文件图像的格式类别(交货单、收据等)确定为标签。
另外,格式图像获取部25获取已记入格式的图像,该已记入格式的图像是想要通过机器学习后的分类器27来确定格式的类别的图像。在该实施方式中,格式图像获取部25使用图像读取装置11来获取从这样的已记入格式中读取的格式图像。
图像缩小部26将所获取的已记入格式的图像缩小为预定大小。即,图像缩小部26将所获取的已记入格式的图像缩小为与用于机器学习中的机器学习用图像相同的大小。即,图像缩小部26对已记入格式的图像进行分辨率转换。
分类器27是将缩小的已记入格式的图像作为输入、将格式类别作为输出的分类器,确定与缩小的已记入格式的图像对应的格式类别。
分类器27包括进行了机器学习的神经网络(例如,深度神经网络),通过该神经网络,来确定与已记入格式的图像对应的格式类别。作为该神经网络,例如,能够使用如VGG16等那样的现有的卷积神经网络。
格式处理部28按照由分类器27确定的格式类别,对已记入格式的图像执行特定处理。例如,格式处理部28在与格式类别对应的文件夹保存已记入格式的图像文件。
参数设定部29从机器学习处理部32获取由机器学习处理部32确定的机器学习后的参数,并将其设定在分类器27中。
另外,图1中的服务器装置3是云服务器、与局域网连接的服务器等,包括通信装置31以及机器学习处理部32。
通信装置31是与网络2连接、并在与其他装置(图像处理装置1等)之间进行数据通信的网络接口等装置。
机器学习处理部32将上述多个机器学习用图像以及标签设为训练数据而执行分类器27的机器学习。
具体而言,机器学习处理部32基于训练数据以现有的深度学习的方式对作为神经网络的分类器27的参数(神经元之间的耦合系数、神经元的偏倚等)进行最佳化,由此执行分类器27的机器学习。
此外,在图1中,图像处理装置1仅仅为一台,但该系统可以包括多个图像处理装置1,针对这些图像处理装置1的分类器27,机器学习处理部32可以一起进行机器学习,也可以分别进行机器学习。
接着,对上述系统的动作进行说明。
在上述系统中进行格式类别的机器学习,并且在图像处理装置1中,通过进行了机器学习的分类器来进行格式图像的分类。
(a)格式类别的机器学习
图4是说明图1所示的格式类别学习系统中的格式类别的机器学习的图。
首先,准备用于机器学习的、多个格式类别的已记入格式(表单等)。然后,原始文件图像获取部21使用图像读取装置11而获取该已记入格式的图像(格式图像)。
图像缩小部22将该格式图像缩小为预定大小,噪声附加部23如上面所述那样以不同的模式将噪声附加到缩小后的格式图像,由此生成多个机器学习用图像。
标签附加部24将该已记入格式的格式类别作为标签而附加到多个机器学习用图像。
机器学习处理部32获取该多个机器学习用图像和该格式类别作为训练数据,将各机器学习用图像作为输入并将所对应的格式类别作为输出而执行分类器27的参数的最佳化处理,由此进行分类器27的机器学习。
在机器学习的结束之后,参数设定部29从服务器装置3的机器学习处理部32中获取机器学习后的参数,并将其设定在分类器27中。
(b)格式图像的分类
格式图像获取部25使用图像读取装置11而获取应当以格式类别分类的已记入格式的图像(格式图像)。
图像缩小部26将所获取的格式图像缩小为预定大小。
分类器27确定与缩小的格式图像对应的格式类别。
格式处理部28针对所获取的格式图像执行与所确定的格式类别对应的特定处理。
如以上所述,根据上述实施方式,图像处理装置1通过分类器27确定已记入格式的格式类别,该分类器27将已记入格式的图像被缩小为预定大小的、缩小后的已记入格式的图像作为输入,并将格式类别作为输出。并且,该分类器27是通过格式类别学习系统而进行了机器学习的分类器,该格式类别学习系统包括:获取已记入格式的图像作为原始文件图像的原始文件图像获取部21;缩小原始文件图像的图像缩小部22;向由图像缩小部22缩小之前的原始文件图像或者由图像缩小部22缩小之后的原始文件图像附加噪声、并生成多个机器学习用图像的噪声附加部23;将原始文件图像的格式类别作为标签而与多个机器学习用图像相关联的标签附加部24;以及将多个机器学习用图像以及标签设为训练数据而执行分类器27的机器学习的机器学习处理部32。
由此,无需使用格式布局信息而准确地进行格式的分类。另外,通过上述的噪声附加,格式的记入内容难以在机器学习中反映出来,除了记入以外的格式固有的布局容易被进行机器学习,其结果为,难以受到记入内容的影响,格式容易被准确地分类。
此外,对于本领域技术人员来说,对上述实施方式的各种变更和修改是显而易见的。在不脱离该主题的宗旨和范围的且不会削弱其预期的优点的情况下,可以做出这些变更和修改。即,这样的变更和修改旨在包含于权利要求书的范围内。
例如,在上述实施方式中,原始文件图像获取部21、图像缩小部22、噪声附加部23、以及标签附加部24可以设置于与格式图像获取部25、图像缩小部26、分类器27、格式处理部28以及参数设定部29不同的装置中。
另外,在上述实施方式中,机器学习处理部32设置于与图像处理装置1不同的服务器装置3中,但可以设置于图像处理装置1中。
并且,在上述实施方式中,噪声附加部23在上述附加位置的浓度与背景浓度(例如,白色)不同的情况下,可以将伪字符图像转换为白色,并将转换后的伪字符图像附加到该附加位置。
而且,在上述实施方式中,可以使用原始文件图像获取部21以及格式图像获取部25中的一个来替代另一个。在该情况下,可以省略原始文件图像获取部21以及格式图像获取部25中的一个。另外,在上述实施方式中,可以使用图像缩小部22、26中的一个来替代另一个。在该情况下,可以省略图像缩小部22、26中的一个。
本发明例如能够应用于数码复合机中。
Claims (6)
1.一种格式类别学习系统,其特征在于,包括:
原始文件图像获取部,获取已记入格式的图像作为原始文件图像;
图像缩小部,缩小所述原始文件图像;
噪声附加部,对由所述图像缩小部缩小之前的所述原始文件图像或者由所述图像缩小部缩小之后的所述原始文件图像通过以彼此不同的位置模式附加噪声,来生成彼此不同的多个机器学习用图像;
标签附加部,将所述原始文件图像的格式类别作为标签而与所述多个机器学习用图像相关联;以及
机器学习处理部,将所述多个机器学习用图像以及所述标签作为训练数据而执行分类器的机器学习,所述分类器将所述已记入格式的图像作为输入,将所述格式类别作为输出。
2.根据权利要求1所述的格式类别学习系统,其特征在于,
所述噪声附加部将伪字符图像作为所述噪声附加到所述原始文件图像,来生成多个机器学习用图像,
所述伪字符图像具有矩形形状,并且具有在由所述图像缩小部缩小之前的所述原始文件图像或者由所述图像缩小部缩小之后的所述原始文件图像中可能存在的文字的最小大小至最大大小中的任意大小。
3.根据权利要求2所述的格式类别学习系统,其特征在于,
所述噪声附加部向多个附加位置附加所述伪字符图像,所述伪字符图像具有纵横比彼此不同的矩形形状。
4.根据权利要求2所述的格式类别学习系统,其特征在于,
所述噪声附加部检测所述原始文件图像内的框,向所检测出的所述框的内部附加所述伪字符图像。
5.根据权利要求1所述的格式类别学习系统,其特征在于,
所述噪声附加部随机确定所述噪声的附加位置,在所确定的所述附加位置的浓度与背景浓度不同的情况下,将所述附加位置变更为其他位置,
所述其他位置的浓度是所述背景浓度。
6.一种图像处理装置,其特征在于,包括:
格式图像获取部,获取已记入格式的图像;
第一图像缩小部,将所获取的所述已记入格式的图像缩小为预定大小;以及
分类器,将缩小的所述已记入格式的图像作为输入,将格式类别作为输出,
其中,所述分类器是通过格式类别学习系统进行了机器学习的分类器,
所述格式类别学习系统包括:
原始文件图像获取部,获取已记入格式的图像作为原始文件图像;
第二图像缩小部,缩小所述原始文件图像;
噪声附加部,对由所述第二图像缩小部缩小之前的所述原始文件图像或者由所述第二图像缩小部缩小之后的所述原始文件图像通过以彼此不同的位置模式附加噪声,来生成彼此不同的多个机器学习用图像;
标签附加部,将所述原始文件图像的格式类别作为标签而与所述多个机器学习用图像相关联;以及
机器学习处理部,将所述多个机器学习用图像以及所述标签作为训练数据而执行所述分类器的机器学习,
所述预定大小是与用于所述机器学习的所述机器学习用图像相同的大小。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017240285A JP6928876B2 (ja) | 2017-12-15 | 2017-12-15 | フォーム種別学習システムおよび画像処理装置 |
JP2017-240285 | 2017-12-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109934244A CN109934244A (zh) | 2019-06-25 |
CN109934244B true CN109934244B (zh) | 2023-04-28 |
Family
ID=66816080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810714643.0A Active CN109934244B (zh) | 2017-12-15 | 2018-07-03 | 格式类别学习系统以及图像处理装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10762343B2 (zh) |
JP (1) | JP6928876B2 (zh) |
CN (1) | CN109934244B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11775814B1 (en) | 2019-07-31 | 2023-10-03 | Automation Anywhere, Inc. | Automated detection of controls in computer applications with region based detectors |
JP2020095428A (ja) * | 2018-12-12 | 2020-06-18 | 株式会社東芝 | モデル学習システム、モデル学習方法、プログラム、及び記憶媒体 |
US11301224B1 (en) | 2019-04-30 | 2022-04-12 | Automation Anywhere, Inc. | Robotic process automation system with a command action logic independent execution environment |
US11614731B2 (en) | 2019-04-30 | 2023-03-28 | Automation Anywhere, Inc. | Zero footprint robotic process automation system |
US11113095B2 (en) | 2019-04-30 | 2021-09-07 | Automation Anywhere, Inc. | Robotic process automation system with separate platform, bot and command class loaders |
US11243803B2 (en) | 2019-04-30 | 2022-02-08 | Automation Anywhere, Inc. | Platform agnostic robotic process automation |
CN111191715A (zh) * | 2019-12-27 | 2020-05-22 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
US11348353B2 (en) | 2020-01-31 | 2022-05-31 | Automation Anywhere, Inc. | Document spatial layout feature extraction to simplify template classification |
JP7420578B2 (ja) | 2020-02-06 | 2024-01-23 | 株式会社Nttデータ | 帳票仕分システム、帳票仕分方法、及びプログラム |
JP7464903B2 (ja) | 2020-02-19 | 2024-04-10 | 京セラドキュメントソリューションズ株式会社 | 学習用データセット生成システム、学習用データセット生成サーバーおよび学習用データセット生成プログラム |
US11182178B1 (en) | 2020-02-21 | 2021-11-23 | Automation Anywhere, Inc. | Detection of user interface controls via invariance guided sub-control learning |
US11734061B2 (en) | 2020-11-12 | 2023-08-22 | Automation Anywhere, Inc. | Automated software robot creation for robotic process automation |
US11782734B2 (en) | 2020-12-22 | 2023-10-10 | Automation Anywhere, Inc. | Method and system for text extraction from an application window for robotic process automation |
US11968182B2 (en) | 2021-07-29 | 2024-04-23 | Automation Anywhere, Inc. | Authentication of software robots with gateway proxy for access to cloud-based services |
US11820020B2 (en) | 2021-07-29 | 2023-11-21 | Automation Anywhere, Inc. | Robotic process automation supporting hierarchical representation of recordings |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005275447A (ja) * | 2004-03-22 | 2005-10-06 | Casio Comput Co Ltd | 画像処理装置、画像処理方法及びプログラム |
JP2007251690A (ja) * | 2006-03-16 | 2007-09-27 | Sony Corp | 画像処理装置および方法、学習装置および方法、並びにプログラム |
JP2012156860A (ja) * | 2011-01-27 | 2012-08-16 | Murata Mach Ltd | 画像処理装置 |
CN105144239A (zh) * | 2013-04-26 | 2015-12-09 | 奥林巴斯株式会社 | 图像处理装置、程序及图像处理方法 |
JP2016071412A (ja) * | 2014-09-26 | 2016-05-09 | キヤノン株式会社 | 画像分類装置、画像分類システム、画像分類方法、及びプログラム |
JP2017010069A (ja) * | 2015-06-16 | 2017-01-12 | シャープ株式会社 | 情報処理装置 |
US9704054B1 (en) * | 2015-09-30 | 2017-07-11 | Amazon Technologies, Inc. | Cluster-trained machine learning for image processing |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2134255C (en) * | 1993-12-09 | 1999-07-13 | Hans Peter Graf | Dropped-form document image compression |
US6778703B1 (en) * | 2000-04-19 | 2004-08-17 | International Business Machines Corporation | Form recognition using reference areas |
US7210100B2 (en) * | 2000-09-27 | 2007-04-24 | Eizel Technologies, Inc. | Configurable transformation of electronic documents |
JP2006229305A (ja) | 2005-02-15 | 2006-08-31 | Canon Inc | ネットワーク文書管理システム |
JP5082512B2 (ja) * | 2007-03-08 | 2012-11-28 | 富士ゼロックス株式会社 | 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム |
JP5166569B2 (ja) * | 2011-04-15 | 2013-03-21 | 株式会社東芝 | 業務連携支援システムおよび業務連携支援方法 |
US9652688B2 (en) * | 2014-11-26 | 2017-05-16 | Captricity, Inc. | Analyzing content of digital images |
JP6214581B2 (ja) * | 2015-01-30 | 2017-10-18 | キヤノン株式会社 | 文書解析システム、文書解析装置、文書解析方法、及びプログラム |
JP6578858B2 (ja) * | 2015-09-30 | 2019-09-25 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
US10747994B2 (en) * | 2016-12-28 | 2020-08-18 | Captricity, Inc. | Identifying versions of a form |
-
2017
- 2017-12-15 JP JP2017240285A patent/JP6928876B2/ja active Active
-
2018
- 2018-07-03 CN CN201810714643.0A patent/CN109934244B/zh active Active
- 2018-12-15 US US16/221,477 patent/US10762343B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005275447A (ja) * | 2004-03-22 | 2005-10-06 | Casio Comput Co Ltd | 画像処理装置、画像処理方法及びプログラム |
JP2007251690A (ja) * | 2006-03-16 | 2007-09-27 | Sony Corp | 画像処理装置および方法、学習装置および方法、並びにプログラム |
JP2012156860A (ja) * | 2011-01-27 | 2012-08-16 | Murata Mach Ltd | 画像処理装置 |
CN105144239A (zh) * | 2013-04-26 | 2015-12-09 | 奥林巴斯株式会社 | 图像处理装置、程序及图像处理方法 |
JP2016071412A (ja) * | 2014-09-26 | 2016-05-09 | キヤノン株式会社 | 画像分類装置、画像分類システム、画像分類方法、及びプログラム |
JP2017010069A (ja) * | 2015-06-16 | 2017-01-12 | シャープ株式会社 | 情報処理装置 |
US9704054B1 (en) * | 2015-09-30 | 2017-07-11 | Amazon Technologies, Inc. | Cluster-trained machine learning for image processing |
Also Published As
Publication number | Publication date |
---|---|
US20190188462A1 (en) | 2019-06-20 |
JP6928876B2 (ja) | 2021-09-01 |
JP2019109562A (ja) | 2019-07-04 |
CN109934244A (zh) | 2019-06-25 |
US10762343B2 (en) | 2020-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109934244B (zh) | 格式类别学习系统以及图像处理装置 | |
US10140511B2 (en) | Building classification and extraction models based on electronic forms | |
US20210064859A1 (en) | Image processing system, image processing method, and storage medium | |
US20120265759A1 (en) | File processing of native file formats | |
US9247080B2 (en) | Information processing apparatus for acquiring a variation region between image data and read data | |
US11030447B2 (en) | On-device partial recognition systems and methods | |
JP2020173808A (ja) | ページ記述言語ジョブの解析によるニューラルネットワーク用光学式文字認識トレーニングデータの生成 | |
US9177199B2 (en) | Semantic magazine pages | |
JP2009224958A (ja) | 業務手順推定システム及びプログラム | |
CN101609283A (zh) | 图像处理装置及图像处理方法 | |
CN112949477B (zh) | 基于图卷积神经网络的信息识别方法、装置及存储介质 | |
CN111753717A (zh) | 用于提取文本的结构化信息的方法、装置、设备及介质 | |
US10803233B2 (en) | Method and system of extracting structured data from a document | |
US20210264556A1 (en) | Automatically attaching optical character recognition data to images | |
JP6578858B2 (ja) | 情報処理装置及びプログラム | |
JP2018151854A (ja) | 文書処理装置およびプログラム | |
CN111208955B (zh) | 打印方法、装置及服务器 | |
CN107861931B (zh) | 模板文件处理方法、装置、计算机设备和存储介质 | |
CN111027533A (zh) | 一种点读坐标的变换方法、系统、终端设备及存储介质 | |
US11438477B2 (en) | Information processing device, information processing system and computer readable medium | |
CN112101356A (zh) | 一种图片中特定文本的定位方法、装置及存储介质 | |
CN106775960A (zh) | 一种对Windows进程的唯一标示方法及系统 | |
CN103870793B (zh) | 纸媒广告的监测方法和装置 | |
JP2013207449A (ja) | 画像読取装置、画像処理方法および画像処理プログラム | |
JP6682827B2 (ja) | 情報処理装置及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |