CN109934244A - 格式类别学习系统以及图像处理装置 - Google Patents

格式类别学习系统以及图像处理装置 Download PDF

Info

Publication number
CN109934244A
CN109934244A CN201810714643.0A CN201810714643A CN109934244A CN 109934244 A CN109934244 A CN 109934244A CN 201810714643 A CN201810714643 A CN 201810714643A CN 109934244 A CN109934244 A CN 109934244A
Authority
CN
China
Prior art keywords
image
format
original document
machine learning
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810714643.0A
Other languages
English (en)
Other versions
CN109934244B (zh
Inventor
西田笃志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Publication of CN109934244A publication Critical patent/CN109934244A/zh
Application granted granted Critical
Publication of CN109934244B publication Critical patent/CN109934244B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Abstract

本发明提供格式类别学习系统以及图像处理装置。格式类别学习系统包括原始文件图像获取部、图像缩小部、噪声附加部、标签附加部及机器学习处理部。原始文件图像获取部获取已记入格式的图像作为原始文件图像。图像缩小部缩小原始文件图像。噪声附加部向由图像缩小部缩小之前的原始文件图像或由图像缩小部缩小之后的原始文件图像附加噪声,并生成多个机器学习用图像。标签附加部将原始文件图像的格式类别作为标签而与多个机器学习用图像相关联。机器学习处理部将多个机器学习用图像及标签设为训练数据而执行分类器的机器学习,所述分类器将已记入格式的图像作为输入并将格式类别作为输出。本发明能够无需使用格式布局信息就能够准确地进行格式分类。

Description

格式类别学习系统以及图像处理装置
技术领域
本发明涉及格式类别学习系统以及图像处理装置。
背景技术
在某文件管理系统中,确定由数码复合机扫描的文件的格式,并且在与格式对应的文件夹中保存该文件。另外,在该文件管理系统中,基于表示格式内的框/表的位置以及大小、格式内的文字等的格式布局信息,来识别格式。
发明内容
本发明涉及的格式类别学习系统具备原始文件图像获取部、图像缩小部、噪声附加部、标签附加部以及机器学习处理部。原始文件图像获取部获取已记入格式的图像作为原始文件图像。图像缩小部缩小所述原始文件图像。噪声附加部向对由所述图像缩小部缩小之前的所述原始文件图像或者由所述图像缩小部缩小之后的所述原始文件图像附加噪声,来生成多个机器学习用图像。标签附加部将所述原始文件图像的格式类别作为标签而与所述多个机器学习用图像相关联。机器学习处理部将所述多个机器学习用图像以及所述标签作为训练数据而执行分类器的机器学习,所述分类器将已记入格式的图像作为输入,将格式类别作为输出。
附图说明
图1示出本发明的实施方式涉及的格式类别学习系统的结构;
图2示出在图1中的分类器27的机器学习中使用的已记入格式的一个例子;
图3示出与图2所示的已记入格式对应的机器学习用图像的一个例子;
图4说明图1所示的格式类别学习系统中的格式类别的机器学习。
具体实施方式
以下,基于附图,对本发明的实施方式进行说明。
图1是示出本发明的实施方式涉及的格式类别学习系统的结构的框图。在图1所示的系统中,图像处理装置1经由网络2而与服务器装置3之间进行通信。
图1中的图像处理装置1例如为数码复合机等图像形成装置,包括图像读取装置11、输入装置12、显示装置13、存储装置14、通信装置15以及运算处理装置16。
图像读取装置11以光学方式读取文件(这里是已记入的格式)的图像,并生成该图像的图像数据。
输入装置12是检测用户操作并输出表示用户操作的信息的硬键、触控面板等装置。显示装置13是向用户显示各种信息的液晶显示器等装置。例如,输入装置12以及显示装置13被配置在操作面板上,该操作面板设置于框体的表面上。
存储装置14是硬盘、闪存等非易失性的存储装置。
通信装置15是与网络2连接、且在与其他装置(服务器装置3等)之间进行数据通信的网络接口等装置。
运算处理装置16包括执行各种程序的计算机、ASIC(Application SpecificIntegrated Circuit,专用集成电路)等,通过计算机、ASIC等,作为各种处理部而工作。
这里,为了格式类别的机器学习,运算处理装置16作为原始文件图像获取部21、图像缩小部22、噪声附加部23以及标签附加部24而工作。另外,为了格式的分类,运算处理装置16作为格式图像获取部25、图像缩小部26、分类器27、格式处理部28以及参数设定部29而工作。
原始文件图像获取部21获取在分类器27的机器学习中使用的已记入格式的图像来作为原始文件图像。在该实施方式中,原始文件图像获取部21使用图像读取装置11而获取从已记入格式中读取的格式图像。
图2是示出在图1中的分类器27的机器学习中使用的已记入格式的一个例子的图。
图像缩小部22缩小该原始文件图像。即,图像缩小部22对原始文件图像进行分辨率转换。此外,图像缩小部22缩小原始文件图像,以使缩小后的原始文件图像的大小(纵横的像素数)变成预定值(例如,纵向100像素,横向00像素)。
噪声附加部23对由图像缩小部22缩小之前的原始文件图像或者由图像缩小部缩小之后的原始文件图像(这里是缩小后的原始文件图像)附加噪声,并生成多个机器学习用图像。
噪声附加部23通过以彼此不同的位置模式附加噪声,来生成彼此不同的多个机器学习用图像。例如,噪声附加部23随机确定预定数量的噪声的附加位置,并向这些附加位置附加噪声。
或者,噪声附加部23对缩小前的原始文件图像以彼此不同的模式配置噪声并生成多个中间图像,并分别缩小多个中间图像,由此生成彼此不同的多个机器学习用图像。
并且,在该实施方式中,噪声附加部23将伪字符图像附加到原始文件图像来作为上述噪声,并生成多个机器学习用图像。该伪字符图像不是文字图像,而是预定形状且预定大小的图像。例如,将固定浓度的矩形形状的图像设为伪字符图像。
这里,在向由图像缩小部22缩小之前的原始文件图像附加噪声的情况下,“预定大小”是在缩小前的原始文件图像内可能使用的文字的从最小大小到最大大小中的任意大小。另一方面,在向由图像缩小部22缩小之后的原始文件图像附加噪声的情况下,“预定大小”是在原始文件图像内能够使用的缩小后的文字的从最小大小到最大大小为止的任意大小。例如,“预定大小”被设定为(缩小前或者缩小后的)原始文件图像的大小的1~10%的范围内的任意值。
另外,噪声附加部23在应当附加上述噪声的位置(以下,称为附加位置)的浓度与背景浓度(例如,白色)不同的情况下,可以将附加位置变更为具有背景浓度的其他位置。该其他位置例如再次被随机选择。
图3是示出与图2所示的已记入格式对应的机器学习用图像的一个例子的图。例如,如图3所示,多个伪字符图像作为噪声而被附加到随机的位置。
并且,噪声附加部23可以以彼此不同的纵横比向多个附加位置附加伪字符图像。
并且,噪声附加部23可以检测原始文件图像内的框,并向所检测出的框的内部附加伪字符图像。此外,框能够通过现有的方法(边缘提取、模式匹配等)来检测出。
标签附加部24将原始文件图像的格式类别作为标签而与所生成的多个机器学习用图像相关联,并生成包含多个机器学习用图像和格式类别在内的机器学习用的训练数据。
例如,标签附加部24按照通过输入装置12所检测出的用户操作,将原始文件图像的格式类别(交货单、收据等)确定为标签。
另外,格式图像获取部25获取已记入格式的图像,该已记入格式的图像是想要通过机器学习后的分类器27来确定格式的类别的图像。在该实施方式中,格式图像获取部25使用图像读取装置11来获取从这样的已记入格式中读取的格式图像。
图像缩小部26将所获取的已记入格式的图像缩小为预定大小。即,图像缩小部26将所获取的已记入格式的图像缩小为与用于机器学习中的机器学习用图像相同的大小。即,图像缩小部26对已记入格式的图像进行分辨率转换。
分类器27是将缩小的已记入格式的图像作为输入、将格式类别作为输出的分类器,确定与缩小的已记入格式的图像对应的格式类别。
分类器27包括进行了机器学习的神经网络(例如,深度神经网络),通过该神经网络,来确定与已记入格式的图像对应的格式类别。作为该神经网络,例如,能够使用如VGG16等那样的现有的卷积神经网络。
格式处理部28按照由分类器27确定的格式类别,对已记入格式的图像执行特定处理。例如,格式处理部28在与格式类别对应的文件夹保存已记入格式的图像文件。
参数设定部29从机器学习处理部32获取由机器学习处理部32确定的机器学习后的参数,并将其设定在分类器27中。
另外,图1中的服务器装置3是云服务器、与局域网连接的服务器等,包括通信装置31以及机器学习处理部32。
通信装置31是与网络2连接、并在与其他装置(图像处理装置1等)之间进行数据通信的网络接口等装置。
机器学习处理部32将上述多个机器学习用图像以及标签设为训练数据而执行分类器27的机器学习。
具体而言,机器学习处理部32基于训练数据以现有的深度学习的方式对作为神经网络的分类器27的参数(神经元之间的耦合系数、神经元的偏倚等)进行最佳化,由此执行分类器27的机器学习。
此外,在图1中,图像处理装置1仅仅为一台,但该系统可以包括多个图像处理装置1,针对这些图像处理装置1的分类器27,机器学习处理部32可以一起进行机器学习,也可以分别进行机器学习。
接着,对上述系统的动作进行说明。
在上述系统中进行格式类别的机器学习,并且在图像处理装置1中,通过进行了机器学习的分类器来进行格式图像的分类。
(a)格式类别的机器学习
图4是说明图1所示的格式类别学习系统中的格式类别的机器学习的图。
首先,准备用于机器学习的、多个格式类别的已记入格式(表单等)。然后,原始文件图像获取部21使用图像读取装置11而获取该已记入格式的图像(格式图像)。
图像缩小部22将该格式图像缩小为预定大小,噪声附加部23如上面所述那样以不同的模式将噪声附加到缩小后的格式图像,由此生成多个机器学习用图像。
标签附加部24将该已记入格式的格式类别作为标签而附加到多个机器学习用图像。
机器学习处理部32获取该多个机器学习用图像和该格式类别作为训练数据,将各机器学习用图像作为输入并将所对应的格式类别作为输出而执行分类器27的参数的最佳化处理,由此进行分类器27的机器学习。
在机器学习的结束之后,参数设定部29从服务器装置3的机器学习处理部32中获取机器学习后的参数,并将其设定在分类器27中。
(b)格式图像的分类
格式图像获取部25使用图像读取装置11而获取应当以格式类别分类的已记入格式的图像(格式图像)。
图像缩小部26将所获取的格式图像缩小为预定大小。
分类器27确定与缩小的格式图像对应的格式类别。
格式处理部28针对所获取的格式图像执行与所确定的格式类别对应的特定处理。
如以上所述,根据上述实施方式,图像处理装置1通过分类器27确定已记入格式的格式类别,该分类器27将已记入格式的图像被缩小为预定大小的、缩小后的已记入格式的图像作为输入,并将格式类别作为输出。并且,该分类器27是通过格式类别学习系统而进行了机器学习的分类器,该格式类别学习系统包括:获取已记入格式的图像作为原始文件图像的原始文件图像获取部21;缩小原始文件图像的图像缩小部22;向由图像缩小部22缩小之前的原始文件图像或者由图像缩小部22缩小之后的原始文件图像附加噪声、并生成多个机器学习用图像的噪声附加部23;将原始文件图像的格式类别作为标签而与多个机器学习用图像相关联的标签附加部24;以及将多个机器学习用图像以及标签设为训练数据而执行分类器27的机器学习的机器学习处理部32。
由此,无需使用格式布局信息而准确地进行格式的分类。另外,通过上述的噪声附加,格式的记入内容难以在机器学习中反映出来,除了记入以外的格式固有的布局容易被进行机器学习,其结果为,难以受到记入内容的影响,格式容易被准确地分类。
此外,对于本领域技术人员来说,对上述实施方式的各种变更和修改是显而易见的。在不脱离该主题的宗旨和范围的且不会削弱其预期的优点的情况下,可以做出这些变更和修改。即,这样的变更和修改旨在包含于权利要求书的范围内。
例如,在上述实施方式中,原始文件图像获取部21、图像缩小部22、噪声附加部23、以及标签附加部24可以设置于与格式图像获取部25、图像缩小部26、分类器27、格式处理部28以及参数设定部29不同的装置中。
另外,在上述实施方式中,机器学习处理部32设置于与图像处理装置1不同的服务器装置3中,但可以设置于图像处理装置1中。
并且,在上述实施方式中,噪声附加部23在上述附加位置的浓度与背景浓度(例如,白色)不同的情况下,可以将伪字符图像转换为白色,并将转换后的伪字符图像附加到该附加位置。
而且,在上述实施方式中,可以使用原始文件图像获取部21以及格式图像获取部25中的一个来替代另一个。在该情况下,可以省略原始文件图像获取部21以及格式图像获取部25中的一个。另外,在上述实施方式中,可以使用图像缩小部22、26中的一个来替代另一个。在该情况下,可以省略图像缩小部22、26中的一个。
本发明例如能够应用于数码复合机中。

Claims (7)

1.一种格式类别学习系统,其特征在于,包括:
原始文件图像获取部,获取已记入格式的图像作为原始文件图像;
图像缩小部,缩小所述原始文件图像;
噪声附加部,对由所述图像缩小部缩小之前的所述原始文件图像或者由所述图像缩小部缩小之后的所述原始文件图像附加噪声,来生成多个机器学习用图像;
标签附加部,将所述原始文件图像的格式类别作为标签而与所述多个机器学习用图像相关联;以及
机器学习处理部,将所述多个机器学习用图像以及所述标签作为训练数据而执行分类器的机器学习,所述分类器将所述已记入格式的图像作为输入,将所述格式类别作为输出。
2.根据权利要求1所述的格式类别学习系统,其特征在于,
所述噪声附加部将伪字符图像作为所述噪声附加到所述原始文件图像,来生成多个机器学习用图像,
所述伪字符图像是预定形状且预定大小的图像。
3.根据权利要求2所述的格式类别学习系统,其特征在于,
所述预定大小是在由所述图像缩小部缩小之前的所述原始文件图像或者由所述图像缩小部缩小之后的所述原始文件图像中可能存在的文字的最小大小至最大大小中的任意大小。
4.根据权利要求2所述的格式类别学习系统,其特征在于,
所述噪声附加部以彼此不同的纵横比向多个附加位置附加所述伪字符图像。
5.根据权利要求2所述的格式类别学习系统,其特征在于,
所述噪声附加部检测所述原始文件图像内的框,向所检测出的所述框的内部附加所述伪字符图像。
6.根据权利要求1所述的格式类别学习系统,其特征在于,
所述噪声附加部随机确定所述噪声的附加位置,在所确定的所述附加位置的浓度与背景浓度不同的情况下,将所述附加位置变更为具有所述背景浓度的其他位置。
7.一种图像处理装置,其特征在于,包括:
格式图像获取部,获取已记入格式的图像;
第一图像缩小部,将所获取的所述已记入格式的图像缩小为预定大小;以及
分类器,将缩小的所述已记入格式的图像作为输入,将格式类别作为输出,
其中,所述分类器是通过格式类别学习系统进行了机器学习的分类器,
所述格式类别学习系统包括:
原始文件图像获取部,获取已记入格式的图像作为原始文件图像;
第二图像缩小部,缩小所述原始文件图像;
噪声附加部,对由所述第二图像缩小部缩小之前的所述原始文件图像或者由所述第二图像缩小部缩小之后的所述原始文件图像附加噪声,来生成多个机器学习用图像;
标签附加部,将所述原始文件图像的格式类别作为标签而与所述多个机器学习用图像相关联;以及
机器学习处理部,将所述多个机器学习用图像以及所述标签作为训练数据而执行分类器的机器学习,所述分类器将已记入格式的图像作为输入,并将格式类别作为输出。
CN201810714643.0A 2017-12-15 2018-07-03 格式类别学习系统以及图像处理装置 Active CN109934244B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017240285A JP6928876B2 (ja) 2017-12-15 2017-12-15 フォーム種別学習システムおよび画像処理装置
JP2017-240285 2017-12-15

Publications (2)

Publication Number Publication Date
CN109934244A true CN109934244A (zh) 2019-06-25
CN109934244B CN109934244B (zh) 2023-04-28

Family

ID=66816080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810714643.0A Active CN109934244B (zh) 2017-12-15 2018-07-03 格式类别学习系统以及图像处理装置

Country Status (3)

Country Link
US (1) US10762343B2 (zh)
JP (1) JP6928876B2 (zh)
CN (1) CN109934244B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11775814B1 (en) 2019-07-31 2023-10-03 Automation Anywhere, Inc. Automated detection of controls in computer applications with region based detectors
JP2020095428A (ja) * 2018-12-12 2020-06-18 株式会社東芝 モデル学習システム、モデル学習方法、プログラム、及び記憶媒体
US11243803B2 (en) 2019-04-30 2022-02-08 Automation Anywhere, Inc. Platform agnostic robotic process automation
US11301224B1 (en) 2019-04-30 2022-04-12 Automation Anywhere, Inc. Robotic process automation system with a command action logic independent execution environment
US11614731B2 (en) 2019-04-30 2023-03-28 Automation Anywhere, Inc. Zero footprint robotic process automation system
US11113095B2 (en) 2019-04-30 2021-09-07 Automation Anywhere, Inc. Robotic process automation system with separate platform, bot and command class loaders
CN111191715A (zh) * 2019-12-27 2020-05-22 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质
US11348353B2 (en) 2020-01-31 2022-05-31 Automation Anywhere, Inc. Document spatial layout feature extraction to simplify template classification
JP7420578B2 (ja) 2020-02-06 2024-01-23 株式会社Nttデータ 帳票仕分システム、帳票仕分方法、及びプログラム
JP7464903B2 (ja) 2020-02-19 2024-04-10 京セラドキュメントソリューションズ株式会社 学習用データセット生成システム、学習用データセット生成サーバーおよび学習用データセット生成プログラム
US11182178B1 (en) 2020-02-21 2021-11-23 Automation Anywhere, Inc. Detection of user interface controls via invariance guided sub-control learning
US11734061B2 (en) 2020-11-12 2023-08-22 Automation Anywhere, Inc. Automated software robot creation for robotic process automation
US11782734B2 (en) 2020-12-22 2023-10-10 Automation Anywhere, Inc. Method and system for text extraction from an application window for robotic process automation
US11968182B2 (en) 2021-07-29 2024-04-23 Automation Anywhere, Inc. Authentication of software robots with gateway proxy for access to cloud-based services
US11820020B2 (en) 2021-07-29 2023-11-21 Automation Anywhere, Inc. Robotic process automation supporting hierarchical representation of recordings

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005275447A (ja) * 2004-03-22 2005-10-06 Casio Comput Co Ltd 画像処理装置、画像処理方法及びプログラム
JP2007251690A (ja) * 2006-03-16 2007-09-27 Sony Corp 画像処理装置および方法、学習装置および方法、並びにプログラム
JP2012156860A (ja) * 2011-01-27 2012-08-16 Murata Mach Ltd 画像処理装置
CN105144239A (zh) * 2013-04-26 2015-12-09 奥林巴斯株式会社 图像处理装置、程序及图像处理方法
JP2016071412A (ja) * 2014-09-26 2016-05-09 キヤノン株式会社 画像分類装置、画像分類システム、画像分類方法、及びプログラム
JP2017010069A (ja) * 2015-06-16 2017-01-12 シャープ株式会社 情報処理装置
US9704054B1 (en) * 2015-09-30 2017-07-11 Amazon Technologies, Inc. Cluster-trained machine learning for image processing

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2134255C (en) * 1993-12-09 1999-07-13 Hans Peter Graf Dropped-form document image compression
US6778703B1 (en) * 2000-04-19 2004-08-17 International Business Machines Corporation Form recognition using reference areas
US7210100B2 (en) * 2000-09-27 2007-04-24 Eizel Technologies, Inc. Configurable transformation of electronic documents
JP2006229305A (ja) 2005-02-15 2006-08-31 Canon Inc ネットワーク文書管理システム
JP5082512B2 (ja) * 2007-03-08 2012-11-28 富士ゼロックス株式会社 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム
JP5166569B2 (ja) * 2011-04-15 2013-03-21 株式会社東芝 業務連携支援システムおよび業務連携支援方法
US9652688B2 (en) * 2014-11-26 2017-05-16 Captricity, Inc. Analyzing content of digital images
JP6214581B2 (ja) * 2015-01-30 2017-10-18 キヤノン株式会社 文書解析システム、文書解析装置、文書解析方法、及びプログラム
JP6578858B2 (ja) * 2015-09-30 2019-09-25 富士ゼロックス株式会社 情報処理装置及びプログラム
US10747994B2 (en) * 2016-12-28 2020-08-18 Captricity, Inc. Identifying versions of a form

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005275447A (ja) * 2004-03-22 2005-10-06 Casio Comput Co Ltd 画像処理装置、画像処理方法及びプログラム
JP2007251690A (ja) * 2006-03-16 2007-09-27 Sony Corp 画像処理装置および方法、学習装置および方法、並びにプログラム
JP2012156860A (ja) * 2011-01-27 2012-08-16 Murata Mach Ltd 画像処理装置
CN105144239A (zh) * 2013-04-26 2015-12-09 奥林巴斯株式会社 图像处理装置、程序及图像处理方法
JP2016071412A (ja) * 2014-09-26 2016-05-09 キヤノン株式会社 画像分類装置、画像分類システム、画像分類方法、及びプログラム
JP2017010069A (ja) * 2015-06-16 2017-01-12 シャープ株式会社 情報処理装置
US9704054B1 (en) * 2015-09-30 2017-07-11 Amazon Technologies, Inc. Cluster-trained machine learning for image processing

Also Published As

Publication number Publication date
JP6928876B2 (ja) 2021-09-01
CN109934244B (zh) 2023-04-28
JP2019109562A (ja) 2019-07-04
US20190188462A1 (en) 2019-06-20
US10762343B2 (en) 2020-09-01

Similar Documents

Publication Publication Date Title
CN109934244A (zh) 格式类别学习系统以及图像处理装置
CN105144239B (zh) 图像处理装置、图像处理方法
CN103649999B (zh) 用于确定光流的内容自适应系统、方法和设备
CN105005980B (zh) 图像处理方法及装置
JP6688277B2 (ja) プログラム、学習処理方法、学習モデル、データ構造、学習装置、および物体認識装置
KR20200145827A (ko) 얼굴 특징 추출 모델 학습 방법, 얼굴 특징 추출 방법, 장치, 디바이스 및 저장 매체
KR102343849B1 (ko) 모션 궤적의 특징 처리 방법, 장치 및 컴퓨터 저장 매체
JP6723798B2 (ja) 情報処理装置、方法、プログラム
DE102017009505A1 (de) Erzeugen einer kompakten Videomerkmaldarstellung in einer digitalen Medienumgebung
DE102013110208A1 (de) Verfahren zum Erkennen einer Bewegung einer kontaktlosen Benutzerschnittstelle und System davon
US20210117484A1 (en) Webpage template generation
CN112016682A (zh) 视频表征学习、预训练方法及装置、电子设备、存储介质
CN103150007A (zh) 一种输入方法及装置
CN104679967B (zh) 一种判断心理测试可靠性的方法
JP7337937B2 (ja) 拡大画像の取得およびストレージ
CN109359029A (zh) 一种自动化非侵入式的安卓应用无障碍支持检测方法
CN105069767B (zh) 基于表征学习与邻域约束嵌入的图像超分辨重构方法
CN105022480A (zh) 一种输入方法及终端
CN112927290A (zh) 基于传感器的裸手数据标注方法及系统
CN114511702A (zh) 一种基于多尺度分权注意力的遥感图像分割方法和系统
JP2016015019A (ja) サービス提供装置、方法、及びプログラム
JP7292176B2 (ja) 土質特性推定方法、装置、プログラム、およびシステム
CN112434547B (zh) 一种用户身份稽核方法和设备
CN106547891A (zh) 针对掌上显示设备的图片化文本信息的快速可视化方法
CN113191942A (zh) 生成图像的方法、训练人物检测模型的方法、程序及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant