JP7516734B2 - ワークフロー支援装置、ワークフロー支援システム及びプログラム - Google Patents
ワークフロー支援装置、ワークフロー支援システム及びプログラム Download PDFInfo
- Publication number
- JP7516734B2 JP7516734B2 JP2019155624A JP2019155624A JP7516734B2 JP 7516734 B2 JP7516734 B2 JP 7516734B2 JP 2019155624 A JP2019155624 A JP 2019155624A JP 2019155624 A JP2019155624 A JP 2019155624A JP 7516734 B2 JP7516734 B2 JP 7516734B2
- Authority
- JP
- Japan
- Prior art keywords
- workflow
- document
- classification
- documents
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Geometry (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Graphics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
なお、ワークフローとは、組織における業務の一連の流れをいう。また、証憑とは、取引の成立を立証する書類をいい、経理関係においては、請求書、納品書、領収書等をいう。
前記ワークフロー検索手段は、抽出文字列、前記分類手段により分類された文書分類、及びワークフロー検索結果から学習して得られた検索条件によりワークフローを検索するワークフロー支援装置である。
前記ワークフロー検索手段は、抽出文字列、前記分類手段により分類された文書分類、及びワークフロー検索結果から学習して得られた検索条件によりワークフローを検索するワークフロー支援システムである。
また、請求項1、8又は9に係る本発明によれば、分類された文書を文書群としてまとめることができる。
さらに、1、8又は9に係る本発明によれば、ワークフロー検索条件を機械学習により求めることができる。
図1は、本発明の実施形態に係るワークフロー支援システム10の全体を示す。
サーバ12は、CPU22、メモリ24、記憶装置26、入出力インターフェイス28及び通信インターフェイス30を有し、これらCPU22、メモリ24、記憶装置26、入出力インターフェイス24及び通信インターフェイス30がバス32を介して接続されている。
以下、証憑を受け付けた例について説明する。
なお、画像解析部36により抽出するのは、上記したページ番号、抽出文字列、矩形座標位置、文字サイズ、文字色以外に、例えば矩形座標位置から計算した矩形座標位置面積等を含めることができる。
図7には、1ページ目が送付状で、2ページ目が領収書である画像解析結果が示されている。図6に示した特徴語パラメータにより特徴語を抽出すると、図7に示した結果となる。即ち、1ページ目においては、文字サイズが上位2番目までという特徴語パラメータにより「送付状」及び「富士太郎様」が抽出され、文字色が黒以外という特徴語は無いので、それ以外の文字列は抽出されない。2ページ目においては、文字サイズが上位2番目までという特徴語パラメータにより「領収書」及び「××株式会社」が抽出され、文字が黒以外という特徴語パラメータにより「領収書番号」が抽出される。
なお、主文書とは、主体となる文書であり、付属文書とは、主文書に付属する文書であり、続き文書とは、前の頁に続く文書である。ここでは、主文書候補、付属文書候補、としているのは、後の処理により変更される場合があるからである。
この例においては、1ページ目は、特徴語に分類用キーワード「送付状」が含まれているので、「付属文書」に分類され、2ページ目は、特徴語に分類用キーワード「請求書」が含まれているので、「主文書」に分類され、3ページ目は、特徴語に分類用キーワード「明細書」が含まれているので、「付属文書」に分類され、4ページ目は、特徴語に分類用キーワードが含まれていないので、「続き文書」に分類され、5ページ目は、特徴語に分類用キーワード「領収書」が含まれているので、「主文書」に分類され、6ページ目は、特徴語に分類用キーワードが含まれないので、「続き文書」に分類され、7ページ目は、同じく特徴語に分類キーワードが含まれていないので、「続き文書」に分類される。
まず、ステップS10において、画像形成装置16の画像読取装置20により読み取られた文書の画像を受け付ける。次のステップS12において、受け付けた文書の画像を解析して文字列を抽出する。次のステップS14において、文書をページ毎に分類する。次のステップS16において、分類された各ページをまとめるようにして文書群として分割する。次のステップS18において、文書群を添付すべきワークフローを検索する。そして、ステップS20において、検索された文書を起動する。
まずステップS30において、ワークフロー起動点数テーブル68を読み込む。次のステップS32において、文書群を読み込む。
12 サーバ
14 パーソナルコンピュータ
16 画像形成装置
18 ネットワーク
20 画像読取装置
22 CPU
24 メモリ
26 記憶装置
28 入出力インターフェイス
30 通信インターフェイス
34 画像データ受付部
36 画像解析部
37 納品書
38 明細書
40 送付状
42 画像解析結果記憶部
44 文書分類部
45 特徴語パラメータ分類表記憶部
46 分類辞書記憶部
48 学習部
49 機械学習データ記憶部
50 文書分類部
52 ワークフロー登録部
54 ワークフロー記憶部
56 表示データ生成部
58 ワークフロー登録画面
60 ワークフロー名登録入力部
62 ワークフローキーワード入力部
64 起動条件入力部
66 ワークフロー検索部
68 起動点数テーブル
70 ワークフロー制御部
Claims (9)
- 原稿を読み込んで取得した画像データから原稿に含まれる文書を分類する分類手段と、
前記分類手段により分類された文書から、該文書を添付すべきワークフローを検索するワークフロー検索手段と、
前記分類手段により分類された文書のうち、関連性がある文書を文書群としてまとめるように分割する分割手段と、を有し、
前記ワークフロー検索手段は、抽出文字列、前記分類手段により分類された文書分類、及びワークフロー検索結果から学習して得られた検索条件によりワークフローを検索する、
ワークフロー支援装置。 - 前記分類手段は、ページ毎に主文書と付属文書とに分けて分類する請求項1記載のワークフロー支援装置。
- 前記分類手段は、前記画像データから抽出した抽出文字列から主文書と付属文書とに分ける請求項2記載のワークフロー支援装置。
- 前記分類手段は、前記画像データから抽出した抽出文字列が予め定められた分類用キーワードを含むか否かを判定して文書を分類する請求項3記載のワークフロー支援装置。
- 前記分類手段は、前記抽出文字列のうち、予め定められた分類用キーワードを含み、且つ予め定められた選定条件を満たす特徴語を含むか否かを判定して文書を分類する請求項4記載のワークフロー支援装置。
- 前記分類手段は、前記抽出文字列のうち、文字列のサイズ及び色について予め定められた選定条件を満たす特徴語を含むか否かを判定して文書を分類する請求項5記載のワークフロー支援装置。
- 前記分類手段は、抽出文字列及び文書分類結果から学習して得られた分類条件により文書を分類する請求項1から3いずれか1項に記載のワークフロー支援装置。
- 原稿を読み取る画像読取手段と、
前記画像読取手段により読み取った画像データから原稿に含まれる文書を分類する分類手段と、
前記分類手段により分類された文書から、該文書を添付すべきワークフローを検索するワークフロー検索手段と、
前記分類手段により分類された文書のうち、関連性がある文書を文書群としてまとめるように分割する分割手段と、を有し、
前記ワークフロー検索手段は、抽出文字列、前記分類手段により分類された文書分類、及びワークフロー検索結果から学習して得られた検索条件によりワークフローを検索する、
ワークフロー支援システム。 - 原稿を読み込んで取得した画像データから原稿に含まれる文書を分類する分類ステップと、
前記分類ステップにおいて分類された文書から、該文書を添付すべきワークフローを検索する検索ステップと、
前記分類ステップにおいて分類された文書のうち、関連性がある文書を文書群としてまとめるように分割する分割ステップと、をコンピュータに実行させるためのプログラムであって、
前記検索ステップでは、抽出文字列、前記分類ステップおいて分類された文書分類、及びワークフロー検索結果から学習して得られた検索条件によりワークフローを検索する、
プログラム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019155624A JP7516734B2 (ja) | 2019-08-28 | 2019-08-28 | ワークフロー支援装置、ワークフロー支援システム及びプログラム |
| US16/790,764 US11657367B2 (en) | 2019-08-28 | 2020-02-14 | Workflow support apparatus, workflow support system, and non-transitory computer readable medium storing program |
| CN202010092026.9A CN112445911A (zh) | 2019-08-28 | 2020-02-14 | 工作流程辅助装置、系统、方法及存储介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019155624A JP7516734B2 (ja) | 2019-08-28 | 2019-08-28 | ワークフロー支援装置、ワークフロー支援システム及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021033831A JP2021033831A (ja) | 2021-03-01 |
| JP7516734B2 true JP7516734B2 (ja) | 2024-07-17 |
Family
ID=74676634
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019155624A Active JP7516734B2 (ja) | 2019-08-28 | 2019-08-28 | ワークフロー支援装置、ワークフロー支援システム及びプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US11657367B2 (ja) |
| JP (1) | JP7516734B2 (ja) |
| CN (1) | CN112445911A (ja) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2022148910A (ja) * | 2021-03-24 | 2022-10-06 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、情報処理システム、および情報処理プログラム |
| JP7746724B2 (ja) * | 2021-08-05 | 2025-10-01 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
| CN114139510B (zh) * | 2021-11-08 | 2022-11-25 | 盟拓软件(苏州)有限公司 | 基于excel表格的流程运行方法和装置、电子设备、存储介质 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002109468A (ja) | 2000-09-29 | 2002-04-12 | Toshiba Corp | 文字認識装置及び文字認識方法 |
| JP2006126941A (ja) | 2004-10-26 | 2006-05-18 | Canon Inc | 画像処理装置、画像処理方法、画像処理制御プログラム、及び記憶媒体 |
| JP2009212613A (ja) | 2008-02-29 | 2009-09-17 | Oki Data Corp | 画像処理装置および画像処理方法 |
| US20140164914A1 (en) | 2003-12-19 | 2014-06-12 | Kofax, Inc. | Automatic document separation |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0969130A (ja) * | 1995-09-01 | 1997-03-11 | Hitachi Ltd | 帳票記入マニュアルの構成方法 |
| TWI234718B (en) * | 2003-12-11 | 2005-06-21 | Inst Information Industry | System, method and machine-readable storage medium of automated workflow execution by document reasoning |
| JP2006243830A (ja) | 2005-02-28 | 2006-09-14 | Ricoh Co Ltd | 画像機器を利用したワークフロー支援システム及びワークフロー検索システム |
| US7734554B2 (en) * | 2005-10-27 | 2010-06-08 | Hewlett-Packard Development Company, L.P. | Deploying a document classification system |
| JP2010198430A (ja) | 2009-02-26 | 2010-09-09 | Konica Minolta Business Technologies Inc | ワークフロー処理システム及びプログラム並びに方法 |
| US8316030B2 (en) * | 2010-11-05 | 2012-11-20 | Nextgen Datacom, Inc. | Method and system for document classification or search using discrete words |
| CN106294568A (zh) * | 2016-07-27 | 2017-01-04 | 北京明朝万达科技股份有限公司 | 一种基于bp网络的中文文本分类规则生成方法及系统 |
| US10832049B2 (en) * | 2018-05-31 | 2020-11-10 | Intematlonal Business Machlnes Corporation | Electronic document classification system optimized for combining a plurality of contemporaneously scanned documents |
| US11017221B2 (en) * | 2018-07-01 | 2021-05-25 | International Business Machines Corporation | Classifying digital documents in multi-document transactions based on embedded dates |
-
2019
- 2019-08-28 JP JP2019155624A patent/JP7516734B2/ja active Active
-
2020
- 2020-02-14 CN CN202010092026.9A patent/CN112445911A/zh active Pending
- 2020-02-14 US US16/790,764 patent/US11657367B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002109468A (ja) | 2000-09-29 | 2002-04-12 | Toshiba Corp | 文字認識装置及び文字認識方法 |
| US20140164914A1 (en) | 2003-12-19 | 2014-06-12 | Kofax, Inc. | Automatic document separation |
| JP2006126941A (ja) | 2004-10-26 | 2006-05-18 | Canon Inc | 画像処理装置、画像処理方法、画像処理制御プログラム、及び記憶媒体 |
| JP2009212613A (ja) | 2008-02-29 | 2009-09-17 | Oki Data Corp | 画像処理装置および画像処理方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20210064863A1 (en) | 2021-03-04 |
| CN112445911A (zh) | 2021-03-05 |
| US11657367B2 (en) | 2023-05-23 |
| JP2021033831A (ja) | 2021-03-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4118349B2 (ja) | 文書選択等の方法及び文書サーバ | |
| US8953228B1 (en) | Automatic assignment of note attributes using partial image recognition results | |
| US7081975B2 (en) | Information input device | |
| US9002838B2 (en) | Distributed capture system for use with a legacy enterprise content management system | |
| US9158833B2 (en) | System and method for obtaining document information | |
| US8310711B2 (en) | Output device and its control method for managing and reusing a job history | |
| US11361572B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
| JP2010510563A (ja) | ハード・コピーの書式からの書式定義の自動発生 | |
| JP7516734B2 (ja) | ワークフロー支援装置、ワークフロー支援システム及びプログラム | |
| US11082583B2 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
| JP2007286767A (ja) | 画像検索システム、及び、画像検索サーバ及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 | |
| US20150310269A1 (en) | System and Method of Using Dynamic Variance Networks | |
| US7743320B1 (en) | Method and system for determining page numbers of page images | |
| WO2021140682A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
| CN112580414B (zh) | 信息处理装置、信息处理方法及计算机可读介质 | |
| JP7271987B2 (ja) | 情報処理装置及びプログラム | |
| JP2013020302A (ja) | 帳票認識システム | |
| JP2000231505A (ja) | データオブジェクト群の自動命名方法およびその記憶媒体 | |
| JP7172343B2 (ja) | 文書検索用プログラム | |
| JP5436040B2 (ja) | 画像入出力装置および監視システム | |
| EP4439441A1 (en) | Card assessment device, card assessment method, program, and card identification system | |
| JP7533044B2 (ja) | プログラムおよびデバイス | |
| JP7547729B2 (ja) | 情報処理装置、情報処理システムおよびプログラム | |
| JP4811133B2 (ja) | 画像形成装置及び画像処理装置 | |
| JP2011095889A (ja) | 画像読取装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20201102 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220721 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230613 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230711 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240109 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240408 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20240419 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240604 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240617 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7516734 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |