CN112445911A - 工作流程辅助装置、系统、方法及存储介质 - Google Patents
工作流程辅助装置、系统、方法及存储介质 Download PDFInfo
- Publication number
- CN112445911A CN112445911A CN202010092026.9A CN202010092026A CN112445911A CN 112445911 A CN112445911 A CN 112445911A CN 202010092026 A CN202010092026 A CN 202010092026A CN 112445911 A CN112445911 A CN 112445911A
- Authority
- CN
- China
- Prior art keywords
- workflow
- document
- classification
- unit
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 14
- 230000000694 effects Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000010191 image analysis Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 230000001419 dependent effect Effects 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012015 optical character recognition Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种工作流程辅助装置、系统、方法及存储介质,所述工作流程辅助装置,其具有:分类单元,从读入原稿而获取的图像数据中将原稿中所含的文件进行分类;以及工作流程搜索单元,从通过所述分类单元分类的文件中,搜索应添附该文件的工作流程。
Description
技术领域
本发明涉及一种工作流程辅助装置、工作流程辅助系统、存储介质及工作流程辅助方法。
背景技术
专利文献1中公开有一种在任务结构动态变化的动态工作流程的辅助系统中利用了图像设备的工作流程辅助系统,所述工作流程辅助系统利用具有以下特征的图像设备,即具有读取使用图像水印技术在纸面上印刷的信息并数码数据化的单元、及将在纸面上印刷的信息利用字符识别技术来数码数据化的单元中的至少任一个,且具有用于利用该数码数据来改变工作流程的结构或状态的单元。
专利文献2中公开有一种对从预先注册的复数个工作流程中选择的工作流程进行处理的工作流程处理装置,所述工作流程处理装置的特征在于,在显示部具备至少显示登录画面、工作流程的一览画面、及从该一览画面过渡的工作流程搜索画面的控制部,所述控制部使根据包含确定登录用户的信息的第1信息从所述复数个工作流程中搜索的1个以上的工作流程默认显示于所述一览画面,且使根据不包含确定所述登录用户的信息的第2信息从所述复数个工作流程中搜索的1个以上的工作流程默认显示于所述搜索画面。
专利文献1:日本特开2006-243830号公报
专利文献2:日本特开2010-198430号公报
一直以来,已知将工作流程的选择信息作为二维码(注册商标)印刷到记录媒体上,并将其作为盖板夹入到凭证中,通过读取该盖板,进行凭证的自动划分及工作流程选择的自动化。
另外,工作流程是指组织中的任务的一连串的流程。并且,凭证是指证明交易的成立的文件,在会计关系中指账单、交货单、收据等。
发明内容
本发明的目的在于提供一种工作流程辅助装置、工作流程辅助系统、存储介质及工作流程辅助方法,能够不在原稿中夹着表示文件的特征的记录媒体而将原稿的文件进行分类并添附文件来启动工作流程。
方案1所述的发明为工作流程辅助装置,其具有:分类单元,从读入原稿而获取的图像数据中将原稿中所含的文件进行分类;以及工作流程搜索单元,从通过所述分类单元分类的文件中搜索应添附该文件的工作流程。
方案2所述的发明在方案1所述的工作流程辅助装置中,所述分类单元将每一页分为主文件和附属文件来进行分类。
方案3所述的发明在方案2所述的工作流程辅助装置中,所述分类单元将从所述图像数据提取的提取字符串分为主文件和附属文件。
方案4所述的发明在方案3所述的工作流程辅助装置中,所述分类单元判定从所述图像数据提取的提取字符串是否包含预先设定的分类用关键词来对文件进行分类。
方案5所述的发明在方案4所述的工作流程辅助装置中,所述分类单元判定在所述提取字符串中是否包含包括预先设定的分类用关键词且满足预先设定的选定条件的特征词来对文件进行分类。
方案6所述的发明在方案5所述的工作流程辅助装置中,所述分类单元判定在所述提取字符串中是否包含满足关于字符串的尺寸及颜色预先设定的选定条件的特征词来对文件进行分类。
方案7所述的发明在方案1至3中任一项所述的工作流程辅助装置中,所述分类单元通过从提取字符串及文件分类结果学习而获得的分类条件来对文件进行分类。
方案8所述的发明在方案1所述的工作流程辅助装置中,所述工作流程辅助装置还具有分割单元,在通过所述分类单元分类的文件中,以将具有关联性的文件作为文件组来汇总的方式进行分割。
方案9所述的发明在方案8所述的工作流程辅助装置中,所述工作流程搜索单元根据从通过所述分割单元分割的文件组提取的提取字符串是否包含预先设定的工作流程搜索用关键词来搜索工作流程。
方案10所述的发明在方案8所述的工作流程辅助装置中,所述工作流程搜索单元通过预先设定的条件对包含工作流程搜索用关键词的提取字符串进行评价来搜索工作流程。
方案11所述的发明在方案8所述的工作流程辅助装置中,所述工作流程搜索单元根据通过提取字符串、所述分类单元分类的文件分类、及从工作流程搜索结果学习而获得的搜索条件来搜索工作流程。
方案12所述的发明为工作流程辅助系统,具有:图像读取单元,读取原稿;分类单元,从通过所述图像读取单元读取的图像数据中将原稿中所含的文件进行分类;以及工作流程搜索单元,从通过所述分类单元分类的文件搜索应添附该文件的工作流程。
方案13所述的发明为存储介质,其存储有用于使计算机实现如下步骤的程序:从读取原稿而获取的图像数据中将原稿中所含的文件进行分类的步骤;以及从被分类的文件中搜索应添附该文件的工作流程的步骤。
方案14所述的发明为工作流程辅助方法,其包括如下步骤:分类步骤,从读入原稿而获取的图像数据中将原稿中所含的文件进行分类;以及工作流程搜索步骤,从通过所述分类单元分类的文件中搜索应添附该文件的工作流程。
发明效果
根据本发明的第1、12、13或14方案,能够不在原稿中夹着表示文件的特征的记录媒体而将原稿的文件进行分类并添附文件来启动工作流程。
根据本发明的第2方案,除了方案1所述的本发明的效果以外,还能够分为主文件和附属文件来进行分类。
根据本发明的第3方案,除了方案2所述的本发明的效果以外,与从图像数据本身将文件进行分类相比,能够正确地将文件进行分类。
根据本发明的第4方案,除了方案3所述的本发明的效果以外,与从整个文件的单词进行分类相比,能够简单地将文件进行分类。
根据本发明的第5方案,除了方案4所述的本发明的效果以外,能够限定选定条件。
根据本发明的第6方案,除了方案5所述的本发明的效果以外,能够通过字符串的尺寸及颜色来限定选定条件。
根据本发明的第7方案,除了方案1至3中任一项所述的本发明的效果以外,能够通过机器学习来求出分类条件。
根据本发明的第8方案,除了方案1所述的本发明的效果以外,能够将已分类的文件作为文件组来汇总。
根据本发明的第9方案,除了方案8所述的本发明的效果以外,能够限定用于搜索工作流程的选定条件。
根据本发明的第10方案,除了方案9所述的本发明的效果以外,与以仅包含工作流程用关键词来检测工作流程时相比,能够正确地检测工作流程。
根据本发明的第11方案,除了方案8所述的本发明的效果以外,能够通过机器学习来求出工作流程搜索条件。
附图说明
根据以下附图,对本发明的实施方式进行详细叙述。
图1是表示本发明的实施方式所涉及的工作流程辅助系统整体的框图;
图2是表示本发明的实施方式所涉及的工作流程辅助装置的硬件的框图;
图3是表示本发明的实施方式所涉及的工作流程辅助装置的功能的框图;
图4表示在本发明的实施方式所涉及的工作流程辅助系统中使用的凭证的一例,图4的(a)是表示交货单的俯视图,图4的(b)是表示说明书的俯视图;
图5表示本发明的实施方式所涉及的工作流程辅助装置中的图像分析结果,图5的(a)是表示发送单的分析结果的图表,图5的(b)是表示发送单的分析结果的俯视图;
图6是表示在本发明的实施方式所涉及的工作流程辅助装置的文件分类部使用的特征词参数的图表;
图7是表示基于本发明的实施方式所涉及的工作流程辅助装置的提取字符串与特征词的图表;
图8是表示在本发明的实施方式所涉及的工作流程辅助装置的文件分类部使用的分类词库的图表;
图9是表示通过本发明的实施方式所涉及的工作流程辅助装置的文件分类部分类的文件的一例的说明图;
图10是表示通过本发明的实施方式所涉及的工作流程辅助装置的文件分割部分割的流程的说明图;
图11是表示通过本发明的实施方式所涉及的工作流程辅助装置的文件分割部分割的结果的说明图;
图12是表示通过本发明的实施方式所涉及的工作流程辅助装置输出的工作流程注册画面的画面图;
图13是表示在本发明的实施方式所涉及的工作流程辅助装置的工作流程存储部注册的工作流程一览表的图表;
图14是表示在本发明的实施方式所涉及的工作流程辅助装置的工作流程搜索部使用的工作流程启动点数表的图表;
图15是表示利用在本发明的实施方式所涉及的工作流程辅助装置的工作流程搜索部使用的工作流程启动点数表来将工作流程点数化的结果的图表;
图16是表示根据利用在本发明的实施方式所涉及的工作流程辅助装置的工作流程搜索部使用的工作流程启动点数表来将工作流程点数化的结果由工作流程控制部启动工作流程的流程的说明图;
图17是表示本发明的实施方式所涉及的工作流程辅助装置的整体流程的流程图;
图18是表示从本发明的实施方式所涉及的工作流程辅助装置的工作流程搜索至启动工作流程为止的控制流程的流程图;
图19是表示在本发明的实施方式所涉及的工作流程辅助装置中,在成为保留状态时输出的画面的画面图。
符号说明
10-工作流程辅助系统,12-服务器,14-个人计算机,16-图像形成装置,18-网络,20-图像读取装置,22-CPU,24-存储器,26-存储装置,28-输入输出接口,30-通信接口,34-图像数据接收部,36-图像分析部,37-交货单,38-明细表,40-发送单,42-图像分析结果存储部,44-文件分类部,45-特征词参数分类表存储部,46-分类词库存储部,48-学习部,49-机器学习数据存储部,50-文件分类部,52-工作流程注册部,54-工作流程存储部,56-表示数据生成部,58-工作流程注册画面,60-工作流程名注册输入部,62-工作流程关键词输入部,64-启动条件输入部,66-工作流程搜索部,68-启动点数表,70-工作流程控制部。
具体实施方式
接着,参考附图对本发明的实施方式进行详细说明。
图1表示本发明的实施方式所涉及的工作流程辅助系统10的整体。
工作流程辅助系统10中,构成工作流程辅助装置的服务器12、个人计算机14,14及图像形成装置16经由网络18连接。图像形成装置16为具有打印机功能、传真机功能、扫描功能等的所谓的复合机,设置有带有自动文档馈送器的图像读取装置20。网络18可为局域网,也可为因特网。
图2是表示服务器12的硬件的框图。
服务器12具有CPU22、存储器24、存储装置26、输入输出接口28及通信接口30,这些CPU22、存储器24、存储装置26、输入输出接口24及通信接口30经由总线32连接。
CPU22根据容纳于存储器24的控制程序来执行预先设定的处理。存储装置26例如由硬盘构成,存储有所需的软件和数据。输入输出接口28连接于未图示的显示器和键盘,进行与它们的数据的输入输出。通信接口30经由上述的网络18输入输出数据。
图3是表示本实施方式所涉及的工作流程辅助装置的功能的框图。
图像数据接收部34例如接收通过上述的图像形成装置16的图像读取装置20读取的图像。
以下,对接收凭证的例子进行说明。
图像分析部36对于通过图像数据接收部34接收的图像数据按照每一页来分析图像。图像分析通过OCR(光字符阅读器,是optical character reader的缩略语,表示光学式文字读取装置,在这里,指将图像数据转换成文本数据。)处理来进行。
图4的(a)、(b)中,作为通过图像数据接收部34接收的文件的例子,示出交货单37及附属于该交货单37的明细表38。在交货单37中,“交货单”的字符串记载于最初的位置行,在第2行之后记载有收信者、负责人、交货编号、交货日期、件名、发送人的名称及住所等、总金额以及个别编号的摘要、数量及单价等。这些记载通过图像分析部36作为字符串而被提取。并且,在明细表38中,除了“明细表”的记载以外,还记载有与交货单的交货编号相同的交货编号,且通过图像分析部36作为字符串而被提取。
图像分析部36对每一页进行图像分析,读入该图像中的坐标位置与文字。相邻的文字作为一个字符串来识别。提取被提取的字符串(以下称为提取字符串。)的矩形坐标位置(左上、左下、右上、右下)。也可以进一步提取字符串的文字尺寸及文字颜色。文字尺寸例如能够根据提取字符串的文字数、矩形坐标的宽度及高度来计算。
在图5中示出进行图像分析的结果的例子。如图5的(b)所示,在发送单40中例如包含“发送单”及“2019年1月1日”的字符串。字符识别结果如图5的(a)所示作为一览表存储于分析结果存储部42。即,“发送单”及“2019年1月1日”各自的提取字符串、矩形坐标位置、文字尺寸及文字颜色作为分析结果存储于分析结果存储部42。
另外,通过图像分析部36进行提取时,除了上述页码、提取字符串、矩形坐标位置、文字尺寸、文字颜色以外,例如还包含根据矩形坐标位置计算的矩形坐标位置面积等。
文件分类部44根据通过图像分析部36分析的字符串对于各页为哪种文件进行分类。首先,文件分类部44通过在特征词参数分类表存储部45中存储的特征词参数来提取特征词。特征词是对页面赋予特征的字符串。特征词参数是指用于提取特征词的尺度。
如图6所示,特征词参数例如将文字尺寸在该页内为第2个以内、文字颜色为除黑色以外等作为选定条件来设定。
对提取特征词的具体例进行说明。
在图7中,示出第1页为发送单,且第2页为收据的图像分析结果。若通过图6所示的特征词参数提取特征词,则成为图7所示的结果。即在第1页中,通过文字尺寸正数第2个为止的特征词参数来提取“发送单”及“富士太郎”,由于不存在满足文字颜色除了黑色以外的特征词,因此未提取除此以外的字符串。在第2页中,通过文字尺寸为正数第2个为止的特征词参数来提取“收据”及“××公司”,通过文字除了黑色以外的特征词参数来提取“收据编号”。
接着,文件分类部44使用特征词的提取结果来决定页面划分。文件分类部44使用在分类词库存储部46中存储的分类词库来分类为主文件、附属文件以及连续文件。分类词库与预先设定的分类用关键词对应地规定有分类类别候补。例如如图8所示,作为分类用关键词,收据、账单、发票、交货单、提单为主文件候补,明细表、发送单、规格书为附属文件候补,当没有分类用关键词时为连续文件。
另外,主文件为成为主体的文件,附属文件为附属于主文件的文件,连续文件为紧接着前一页的文件。在这里,设为主文件候补、附属文件候补是由于有时存在通过后面的处理而发生改变的情况。
文件分类部44决定上述的特征词在分类用关键词中是否存在、当存在时决定其为主文件候补还是附属文件候补。当分类用关键词在特征词中不存在时,设为连续文件。
图9中示出进行了页面划分的例子。
在该例子中,第1页在特征词中包含分类用关键词“发送单”,因此分类为“附属文件”,第2页在特征词中包含分类用关键词“账单”,因此分类为“主文件”,第3页在特征词中包含分类用关键词“明细表”,因此分类为“附属文件”,第4页在特征词中不包含分类用关键词,因此分类为“连续文件”,第5页在特征词中包含分类用关键词“收据”,因此分类为“主文件”,第6页在特征词中不包含分类用关键词,因此分类为“连续文件”,第7页同样地在特征词中不包含分类用关键词,因此分类为“连续文件”。
另外,在上述实施方式中,设为分类词库使用预先设定的分类用关键词来对文件进行分类,但也可以通过机器学习来进行文件的分类。即,可以设为上述的文件分类部44连接于学习部48,该学习部48输入特征词,并将文件分类的结果作为教师数据将相对于特征词的文件的种类积蓄于机器学习数据存储部49,根据该积蓄的数据来决定基于特征词的文件的种类。
文件分割部50将通过文件分类部44分类的文件作为文件组汇总来进行分割。首先作为步骤S1,先将连续文件设为出现至其前一页为止的主文件或与附属文件相同的文件,制作文件划分页。在图10所示的例子中,第4页的“连续文件”作为与第3页的“附属文件”相同的“附属文件”来制作页面划分,第6页及第7页的“连续文件”作为与第5页的”附属文件“相同的“附属文件”来制作页面划分。通过以上,在该步骤S1中,作为第1页、第2页、第3页及第4页、第5页至第7页来进行页面分割。
接着,作为步骤S2,将与主文件接续的附属文件作为一个文件组。在图10所示的例子中,将第2页的“主文件”及紧接着的第3页及第4页的“附属文件”作为第1文件组,将第5页的“主文件”及接续的第6页及第7页的“附属文件”作为第2文件组来分别进行分割。
接着,作为步骤S3,不属于通过步骤S2分割的文件组的附属文件包含于该附属文件之后的文件组。在图10所示的例子中,第1页的”附属文件”包含于第1文件组。
通过以上处理,如图11所示,从第1页至第7页为止的文件汇总分割为第1页至第4页为止的第1文件组、及第5页至第7页为止的第2文件组。
另外,在上述实施方式中,设为分为主文件与附属文件后分割文件组,但也可以如图4所示,当交货单37与明细表38被赋予相同的交货编号时,根据该交货编号来判断交货单37与明细表38为1个文件组。
工作流程注册部52选择预先制作的工作流程并使工作流程存储部54存储工作流程。工作流程注册部52与显示数据生成部56连接,通过该显示数据生成部56生成的工作流程注册画面发送至个人计算机14,14,从该工作流程注册画面来注册工作流程。
图12中示出工作流程注册画面58的一例。在工作流程注册画面58设置有工作流程名注册输入部60、工作流程搜索用关键词输入部62及启动条件输入部64。工作流程名注册输入部60从预先制作的工作流程选择进行注册的工作流程。预先制作的工作流程中附有工作流程名及识别符(指ID。)。在图12所示的例子中,成为账单工作流程(ID:1)。并且,工作流程搜索用关键词输入部62在搜索后述的工作流程的基础上输入关键词。图12所示的例子中,为账单、发票、收据。启动条件输入部64输入使通过关键词选择的工作流程自动启动时的条件。图12所示的例子中,设为选择“主文件必需”或“主文件或附属文件”。当选择“主文件必需”时,当在前述的文件分割部50中分割的文件组中包含主文件时自动启动工作流程,当不包含主文件时,禁止自动启动。当选择“主文件或附属文件”时,若在文件组中有主文件或附属文件则自动启动,当不包含主文件或附属文件中的任一个时禁止自动启动。
另外,启动条件除此以外也可以设为仅在作为“主文件及附属文件必需”而主文件及附属文件包含于文件组时自动启动。并且,也可以设置“其他”选项,在图像分析部36中分析的字符串中,将是否包含有无能够识别为金额的数字、有无能够假定为货物的组件名等作为启动条件。而且,也可以设为“在主文件中不包含公司名称”或“主文件为收据且不包含职员名”等时禁止自动启动。
在工作流程注册部52中注册的工作流程存储于工作流程存储部54而被管理。图13中示出由工作流程存储部54管理的工作流程一览表的例子。例如,工作流程识别符为1的工作流程中,工作流程名为账单处理工作流程、工作流程搜索用关键词为“账单”、“发票”,批准人为上司,启动条件为“主文件必需”,作为其他启动条件有金额。
另外,工作流程识别符为4的工作流程为尚未输入工作流程名等的工作流程。
工作流程搜索部66搜索在工作流程存储部54存储并管理的工作流程。工作流程搜索部66例如根据工作流程启动点数表68进行点数化,并选择点数最高的流程,所述工作流程启动点数表68对于在工作流程存储部54存储的全部工作流程预先设定了构成一个文件组的全部页面的特征词的集合与工作流程搜索用关键词的一致性。工作流程启动点数表68例如如图14所示,分别关于文字尺寸、文字颜色、文件分类分别进行设定。关于文字尺寸,若为20号以上则设为10点,若小于20号则设为5点。关于文字颜色,除了黑色以外则设为7点,若为黑色则设为5点。关于文件分类,若在主文件中有特征词则为10点,若在附属文件中有特征词则为3点。
图15及图16中示出点数集积结果。若第1文件组中特征词“账单”在主文件中设定为20且黑色,则在第1识别符1的账单工作流程中,与工作流程搜索关键词“账单”与特征词“账单”一致,在第1识别符1的账单工作流程中,成为10(文字尺寸:20号以上)+5(文字颜色:黑色)+10(在主文件中存在),成为25点,识别符1的账单工作流程成为最高的点数。因此,第1文件组成为应添附到识别符1的账单工作流程的文件组。并且,在识别符2的收据工作流程中,若第2文件组中所含的特征词“收据”与工作流程搜索用关键词“收据”一致则同样地成为最高点数,第2文件组成为应添附到识别符2的收据工作流程的文件组。
另外,在上述实施方式的情况下,设为工作流程启动点数表68根据预先设定的文字尺寸、文字颜色及文件分类来进行点数化,但也可以通过机器学习来进行。即,也可以设为前述的工作流程启动点数表68与学习部48连接,该学习部48输入文字尺寸、文字颜色及文件分类,并将工作流程搜索结果作为教师数据积蓄于机器学习数据存储部49,并且根据该积蓄的数据来决定工作流程。
工作流程控制部70根据工作流程搜索部66的搜索结果来决定工作流程,并附加对应的文件组来启动工作流程。即,在第1文件组启动第1识别符1的账单工作流程,在第2文件组启动识别符2的收据工作流程。其中,工作流程控制部70在启动条件不一致时,也可以设定成将工作流程设为保留状态,并能够通过进行读取动作的使用者(有时为注册者)的介入来手动启动工作流程。
图17为表示工作流程辅助装置的整体的处理流程的流程图。
首先,在步骤S10中,接收通过图像形成装置16的图像读取装置20读取的文件的图像。接着在步骤S12中,对接收的文件的图像进行分析并提取字符串。接着在步骤S14中,将文件按照每一页进行分类。接着在步骤S16中,将已分类的各页汇总并作为文件组进行分割。接着在步骤S18中,搜索应添附文件组的工作流程。并且,在步骤S20中,启动搜索出的文件。
图18是表示使工作流程启动为止的处理的流程的流程图。
首先在步骤S30中,读入工作流程启动点数表68。接着在步骤S32中,读入文件组。
接着在步骤S34中,读入文件组一览表中的最初的一个文件组的全部页面的特征词。接着在步骤S36中,读入工作流程搜索用关键词。并且,接着在步骤S38中,关于注册工作流程一览表中的最初的一个工作流程执行点数计算。若步骤S38的处理结束,则返回到步骤S36,读入工作流程搜索用关键词,在步骤S38中,关于下一个工作流程执行点数计算。步骤S36与步骤S38的处理执行至对于所有的工作流程的搜索结束为止。
若所有的工作流程的搜索结束,则进入到步骤S40,在该步骤S40中,决定最大点数的工作流程,接着在步骤S42中,启动在步骤S40中决定的工作流程。在步骤S42中,若启动一个工作流程,则返回到步骤S34,读入下一个文件组的整页的特征词,同样地搜索工作流程,并通过搜索结果来启动工作流程。
另外,启动工作流程时需要满足图13所示的启动条件。当满足启动条件时,跳过注册者的确认步骤而启动工作流程。然而,存在例如由于图像分析部36的OCR的误认等而不满足启动条件的情况。此时,进行注册者的确认步骤。
图19中示出为了确认步骤而在表示数据生成部56生成且显示于个人计算机14,14的工作流程附件等待画面72。在图17的例子中,存在判断为未添附主文件的情况。虽然未添附主文件,但添附有2个文件。若选择任一个文件,则显示该文件的名称(标注有标题的部分的字符串)、文件夹名、OCR全文等。注册者能够确认这些数据,通过进一步追加文件或补正字符串来选择应添附的工作流程,通过指示“完成”按钮来启动工作流程。
另外,在上述实施方式中,设为通过1个文件组的种类来启动一个工作流程,但也能够通过1个文件组的内容来选择工作流程。例如若为账单,则可以设为账单金额为预先设定的金额以上时启动其他工作流程,可以通过实例(按照特定的工作流程模板实际发生的一连串的业务任务或活动)来区分工作流程。
上述本发明的实施方式是以例示及说明为目的而提供的。另外,本发明的实施方式并不全面详尽地包括本发明,并且并不将本发明限定于所公开的方式。很显然,对本发明所属的领域中的技术人员而言,各种变形及变更是自知之明的。本实施方式是为了最容易理解地说明本发明的原理及其应用而选择并说明的。由此,本技术领域中的其他技术人员能够通过对假定为各种实施方式的特定使用最优化的各种变形例来理解本发明。本发明的范围由以上的权利要求书及其等同物来定义。
Claims (14)
1.一种工作流程辅助装置,具有:
分类单元,从读入原稿而获取的图像数据中将原稿中所含的文件进行分类;以及
工作流程搜索单元,从通过所述分类单元分类的文件中搜索应添附该文件的工作流程。
2.根据权利要求1所述的工作流程辅助装置,其中,
所述分类单元将每一页分为主文件和附属文件来进行分类。
3.根据权利要求2所述的工作流程辅助装置,其中,
所述分类单元将从所述图像数据提取的提取字符串分为主文件和附属文件。
4.根据权利要求3所述的工作流程辅助装置,其中,
所述分类单元判定从所述图像数据提取的提取字符串是否包含预先设定的分类用关键词来对文件进行分类。
5.根据权利要求4所述的工作流程辅助装置,其中,
所述分类单元判定在所述提取字符串中是否包含包括预先设定的分类用关键词且满足预先设定的选定条件的特征词来对文件进行分类。
6.根据权利要求5所述的工作流程辅助装置,其中,
所述分类单元判定在所述提取字符串中是否包含满足关于字符串的尺寸及颜色预先设定的选定条件的特征词来对文件进行分类。
7.根据权利要求1至3中任一项所述的工作流程辅助装置,其中,
所述分类单元通过从提取字符串及文件分类结果学习而获得的分类条件来对文件进行分类。
8.根据权利要求1所述的工作流程辅助装置,
所述工作流程辅助装置还具有分割单元,在通过所述分类单元分类的文件中,以将具有关联性的文件作为文件组来汇总的方式进行分割。
9.根据权利要求8所述的工作流程辅助装置,其中,
所述工作流程搜索单元根据从通过所述分割单元分割的文件组提取的提取字符串是否包含预先设定的工作流程搜索用关键词来搜索工作流程。
10.根据权利要求8所述的工作流程辅助装置,其中,
所述工作流程搜索单元通过预先设定的条件对包含工作流程搜索用关键词的提取字符串进行评价来搜索工作流程。
11.根据权利要求8所述的工作流程辅助装置,其中,
所述工作流程搜索单元根据通过提取字符串、所述分类单元分类的文件分类、及从工作流程搜索结果学习而获得的搜索条件来搜索工作流程。
12.一种工作流程辅助系统,具有:
图像读取单元,读取原稿;
分类单元,从通过所述图像读取单元读取的图像数据中将原稿中所含的文件进行分类;以及
工作流程搜索单元,从通过所述分类单元分类的文件搜索应添附该文件的工作流程。
13.一种存储介质,其存储有用于使计算机实现如下步骤的程序:
从读取原稿而获取的图像数据中将原稿中所含的文件进行分类的步骤;以及
从被分类的文件中搜索应添附该文件的工作流程的步骤。
14.一种工作流程辅助方法,其包括如下步骤:
分类步骤,从读入原稿而获取的图像数据中将原稿中所含的文件进行分类;以及
工作流程搜索步骤,从通过所述分类单元分类的文件中搜索应添附该文件的工作流程。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019-155624 | 2019-08-28 | ||
JP2019155624A JP7516734B2 (ja) | 2019-08-28 | 2019-08-28 | ワークフロー支援装置、ワークフロー支援システム及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112445911A true CN112445911A (zh) | 2021-03-05 |
Family
ID=74676634
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010092026.9A Pending CN112445911A (zh) | 2019-08-28 | 2020-02-14 | 工作流程辅助装置、系统、方法及存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11657367B2 (zh) |
JP (1) | JP7516734B2 (zh) |
CN (1) | CN112445911A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114139510A (zh) * | 2021-11-08 | 2022-03-04 | 盟拓软件(苏州)有限公司 | 基于excel表格的流程运行方法和装置、电子设备、存储介质 |
CN115297215A (zh) * | 2021-08-05 | 2022-11-04 | 京瓷办公信息系统株式会社 | 图像处理装置以及图像形成装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0969130A (ja) * | 1995-09-01 | 1997-03-11 | Hitachi Ltd | 帳票記入マニュアルの構成方法 |
JP2002109468A (ja) * | 2000-09-29 | 2002-04-12 | Toshiba Corp | 文字認識装置及び文字認識方法 |
US8693043B2 (en) * | 2003-12-19 | 2014-04-08 | Kofax, Inc. | Automatic document separation |
JP2006126941A (ja) * | 2004-10-26 | 2006-05-18 | Canon Inc | 画像処理装置、画像処理方法、画像処理制御プログラム、及び記憶媒体 |
JP2006243830A (ja) | 2005-02-28 | 2006-09-14 | Ricoh Co Ltd | 画像機器を利用したワークフロー支援システム及びワークフロー検索システム |
US7734554B2 (en) * | 2005-10-27 | 2010-06-08 | Hewlett-Packard Development Company, L.P. | Deploying a document classification system |
JP4630350B2 (ja) * | 2008-02-29 | 2011-02-09 | 株式会社沖データ | 画像処理装置および画像処理方法 |
JP2010198430A (ja) | 2009-02-26 | 2010-09-09 | Konica Minolta Business Technologies Inc | ワークフロー処理システム及びプログラム並びに方法 |
US8316030B2 (en) * | 2010-11-05 | 2012-11-20 | Nextgen Datacom, Inc. | Method and system for document classification or search using discrete words |
US10832049B2 (en) * | 2018-05-31 | 2020-11-10 | Intematlonal Business Machlnes Corporation | Electronic document classification system optimized for combining a plurality of contemporaneously scanned documents |
US11017221B2 (en) * | 2018-07-01 | 2021-05-25 | International Business Machines Corporation | Classifying digital documents in multi-document transactions based on embedded dates |
-
2019
- 2019-08-28 JP JP2019155624A patent/JP7516734B2/ja active Active
-
2020
- 2020-02-14 US US16/790,764 patent/US11657367B2/en active Active
- 2020-02-14 CN CN202010092026.9A patent/CN112445911A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115297215A (zh) * | 2021-08-05 | 2022-11-04 | 京瓷办公信息系统株式会社 | 图像处理装置以及图像形成装置 |
CN115297215B (zh) * | 2021-08-05 | 2024-05-14 | 京瓷办公信息系统株式会社 | 图像处理装置以及图像形成装置 |
CN114139510A (zh) * | 2021-11-08 | 2022-03-04 | 盟拓软件(苏州)有限公司 | 基于excel表格的流程运行方法和装置、电子设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20210064863A1 (en) | 2021-03-04 |
US11657367B2 (en) | 2023-05-23 |
JP7516734B2 (ja) | 2024-07-17 |
JP2021033831A (ja) | 2021-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8792141B2 (en) | Embedded form extraction definition to enable automatic workflow configuration | |
US7668372B2 (en) | Method and system for collecting data from a plurality of machine readable documents | |
US9002838B2 (en) | Distributed capture system for use with a legacy enterprise content management system | |
US9454696B2 (en) | Dynamically generating table of contents for printable or scanned content | |
US8310711B2 (en) | Output device and its control method for managing and reusing a job history | |
US9390089B2 (en) | Distributed capture system for use with a legacy enterprise content management system | |
WO2006002009A2 (en) | Document management system with enhanced intelligent document recognition capabilities | |
US8953228B1 (en) | Automatic assignment of note attributes using partial image recognition results | |
US10803233B2 (en) | Method and system of extracting structured data from a document | |
US20230273952A1 (en) | Image processing apparatus, image processing method, and storage medium | |
CN112445911A (zh) | 工作流程辅助装置、系统、方法及存储介质 | |
JP6786658B2 (ja) | 書類読取システム | |
JP6127597B2 (ja) | 情報処理装置、その制御方法及びプログラム | |
US20240211518A1 (en) | Automated document intake system | |
JP6856916B1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
US20210097272A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
WO2021140682A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP2021114224A (ja) | ファイル検索システム、ファイル検索方法及びプログラム | |
JP7312646B2 (ja) | 情報処理装置、文書識別方法、及び情報処理システム | |
US10990338B2 (en) | Information processing system and non-transitory computer readable medium | |
JP7271987B2 (ja) | 情報処理装置及びプログラム | |
US20200304670A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP7533044B2 (ja) | プログラムおよびデバイス | |
JP7484176B2 (ja) | 情報処理装置、情報処理システムおよびプログラム | |
JP7547729B2 (ja) | 情報処理装置、情報処理システムおよびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: No. 3, chiban 9, Dingmu 7, Tokyo port, Japan Applicant after: Fuji film business innovation Co.,Ltd. Address before: No.3, 7-fan-3, Kawasaki, Tokyo, Japan Applicant before: Fuji Xerox Co.,Ltd. |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |