JP7480536B2 - 文書処理装置及びプログラム - Google Patents
文書処理装置及びプログラム Download PDFInfo
- Publication number
- JP7480536B2 JP7480536B2 JP2020043169A JP2020043169A JP7480536B2 JP 7480536 B2 JP7480536 B2 JP 7480536B2 JP 2020043169 A JP2020043169 A JP 2020043169A JP 2020043169 A JP2020043169 A JP 2020043169A JP 7480536 B2 JP7480536 B2 JP 7480536B2
- Authority
- JP
- Japan
- Prior art keywords
- page
- data
- sets
- classified
- candidates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 19
- 230000004044 response Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Character Input (AREA)
Description
本発明に係るプログラムは、コンピュータに、予め定められた複数のページで構成される文書が、複数セット含まれているデータを受け付ける機能、前記データを各セットに分類する機能、前記データにおいて分類できなかったページがある場合、前記ページが属しうるセットの候補を表示させる機能、前記セットの候補の選出根拠を表示させる機能、を実現させる。
本発明に係るプログラムは、コンピュータに、予め定められた複数のページで構成される文書が、複数セット含まれているデータを受け付ける機能、前記データを各セットに分類する機能、前記データにおいて分類できなかったページがある場合、前記ページが属しうるセットの候補を表示させる機能、前記セットの候補が複数存在する場合、分類できなかった前記ページに対する類似度によって前記セットの候補を優先付けて表示させる機能、を実現させる。
Claims (9)
- プロセッサを備え、
前記プロセッサは、
予め定められた複数のページで構成される文書が、複数セット含まれているデータを受け付け、
前記データを各セットに分類し、
前記データにおいて分類できなかったページがある場合、前記ページが属しうるセットの候補を表示させ、
前記セットの候補のページが欠落している位置に、分類できなかった前記ページを挿入して表示させる、
ことを特徴とする文書処理装置。 - プロセッサを備え、
前記プロセッサは、
予め定められた複数のページで構成される文書が、複数セット含まれているデータを受け付け、
前記データを各セットに分類し、
前記データにおいて分類できなかったページがある場合、前記ページが属しうるセットの候補を表示させ、
前記セットの候補の選出根拠を表示させる、
ことを特徴とする文書処理装置。 - 前記選出根拠は、分類されなかった前記ページと前記セットの候補が類似している箇所であることを特徴とする請求項2に記載の文書処理装置。
- プロセッサを備え、
前記プロセッサは、
予め定められた複数のページで構成される文書が、複数セット含まれているデータを受け付け、
前記データを各セットに分類し、
前記データにおいて分類できなかったページがある場合、前記ページが属しうるセットの候補を表示させ、
前記セットの候補が複数存在する場合、分類できなかった前記ページに対する類似度によって前記セットの候補を優先付けて表示させる、
ことを特徴とする文書処理装置。 - 前記プロセッサは、分類できなかった前記ページの受付日時、前記ページに記入されている文字の筆跡または前記ページに記載されている内容のうち、少なくとも1つと類似しているセットを前記セットの候補として表示させることを特徴とする請求項1,2,4のいずれか1項に記載の文書処理装置。
- 前記プロセッサは、前記セットの候補が抽出できなかった場合、分類できなかった前記ページを所定の格納先に登録することを特徴とする請求項1,2,4のいずれか1項に記載の文書処理装置。
- コンピュータに、
予め定められた複数のページで構成される文書が、複数セット含まれているデータを受け付ける機能、
前記データを各セットに分類する機能、
前記データにおいて分類できなかったページがある場合、前記ページが属しうるセットの候補を表示させる機能、
前記セットの候補のページが欠落している位置に、分類できなかった前記ページを挿入して表示させる機能、
を実現させるためのプログラム。 - コンピュータに、
予め定められた複数のページで構成される文書が、複数セット含まれているデータを受け付ける機能、
前記データを各セットに分類する機能、
前記データにおいて分類できなかったページがある場合、前記ページが属しうるセットの候補を表示させる機能、
前記セットの候補の選出根拠を表示させる機能、
を実現させるためのプログラム。 - コンピュータに、
予め定められた複数のページで構成される文書が、複数セット含まれているデータを受け付ける機能、
前記データを各セットに分類する機能、
前記データにおいて分類できなかったページがある場合、前記ページが属しうるセットの候補を表示させる機能、
前記セットの候補が複数存在する場合、分類できなかった前記ページに対する類似度によって前記セットの候補を優先付けて表示させる機能、
を実現させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020043169A JP7480536B2 (ja) | 2020-03-12 | 2020-03-12 | 文書処理装置及びプログラム |
US17/060,177 US11782990B2 (en) | 2020-03-12 | 2020-10-01 | Document processing apparatus and non-transitory computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020043169A JP7480536B2 (ja) | 2020-03-12 | 2020-03-12 | 文書処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021144512A JP2021144512A (ja) | 2021-09-24 |
JP7480536B2 true JP7480536B2 (ja) | 2024-05-10 |
Family
ID=77663670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020043169A Active JP7480536B2 (ja) | 2020-03-12 | 2020-03-12 | 文書処理装置及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11782990B2 (ja) |
JP (1) | JP7480536B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001005831A (ja) | 1999-06-24 | 2001-01-12 | Ricoh Co Ltd | ファイリング方法及びそれを格納した記録媒体 |
JP2006031181A (ja) | 2004-07-13 | 2006-02-02 | Canon Inc | 画像検索装置、方法、記憶媒体及びプログラム |
JP2007066098A (ja) | 2005-08-31 | 2007-03-15 | Canon Inc | 帳票認識装置及び方法、プログラム |
JP2009212613A (ja) | 2008-02-29 | 2009-09-17 | Oki Data Corp | 画像処理装置および画像処理方法 |
JP2009302944A (ja) | 2008-06-13 | 2009-12-24 | Konica Minolta Business Technologies Inc | 画像処理装置 |
JP2016063400A (ja) | 2014-09-18 | 2016-04-25 | 株式会社沖データ | 画像処理装置および画像処理方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3812185B2 (ja) * | 1998-12-01 | 2006-08-23 | 株式会社日立製作所 | 欠陥分類方法およびその装置 |
JP4526661B2 (ja) * | 2000-06-28 | 2010-08-18 | 株式会社日立製作所 | 検査装置および検査方法 |
US20040013302A1 (en) * | 2001-12-04 | 2004-01-22 | Yue Ma | Document classification and labeling using layout graph matching |
US8351706B2 (en) * | 2007-07-24 | 2013-01-08 | Sharp Kabushiki Kaisha | Document extracting method and document extracting apparatus |
US20110258150A1 (en) * | 2010-01-15 | 2011-10-20 | Copanion, Inc. | Systems and methods for training document analysis system for automatically extracting data from documents |
US8737724B2 (en) * | 2011-06-10 | 2014-05-27 | Microsoft Corporation | Image type classifier for improved remote presentation session compression |
US9053361B2 (en) * | 2012-01-26 | 2015-06-09 | Qualcomm Incorporated | Identifying regions of text to merge in a natural image or video frame |
WO2016157467A1 (ja) * | 2015-03-31 | 2016-10-06 | 株式会社Ubic | データ分析システム、データ分析方法、データ分析プログラム、および、記録媒体 |
JP2017107455A (ja) | 2015-12-10 | 2017-06-15 | キヤノン株式会社 | 情報処理装置、制御方法、及びプログラム |
CA3035097C (en) * | 2016-09-02 | 2024-05-21 | FutureVault Inc. | Automated document filing and processing methods and systems |
-
2020
- 2020-03-12 JP JP2020043169A patent/JP7480536B2/ja active Active
- 2020-10-01 US US17/060,177 patent/US11782990B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001005831A (ja) | 1999-06-24 | 2001-01-12 | Ricoh Co Ltd | ファイリング方法及びそれを格納した記録媒体 |
JP2006031181A (ja) | 2004-07-13 | 2006-02-02 | Canon Inc | 画像検索装置、方法、記憶媒体及びプログラム |
JP2007066098A (ja) | 2005-08-31 | 2007-03-15 | Canon Inc | 帳票認識装置及び方法、プログラム |
JP2009212613A (ja) | 2008-02-29 | 2009-09-17 | Oki Data Corp | 画像処理装置および画像処理方法 |
JP2009302944A (ja) | 2008-06-13 | 2009-12-24 | Konica Minolta Business Technologies Inc | 画像処理装置 |
JP2016063400A (ja) | 2014-09-18 | 2016-04-25 | 株式会社沖データ | 画像処理装置および画像処理方法 |
Non-Patent Citations (1)
Title |
---|
松山憲和 外1名,リッチクライアントとWebサービスで実現した簡単操作文書管理システムの開発,情報処理学会研究報告,日本,社団法人情報処理学会,2006年12月01日,第2006巻 第128号,pp.69~76 |
Also Published As
Publication number | Publication date |
---|---|
US20210286990A1 (en) | 2021-09-16 |
US11782990B2 (en) | 2023-10-10 |
JP2021144512A (ja) | 2021-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101178725B (zh) | 用于信息检索的设备和方法 | |
US8726178B2 (en) | Device, method, and computer program product for information retrieval | |
US6735335B1 (en) | Method and apparatus for discriminating between documents in batch scanned document files | |
US11303769B2 (en) | Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium | |
JP2007286864A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
JP6876914B2 (ja) | 情報処理装置 | |
JP7176246B2 (ja) | 文書解析装置、文書構成解析方法及びプログラム | |
US10142499B2 (en) | Document distribution system, document distribution apparatus, information processing method, and storage medium | |
CN113378839A (zh) | 信息处理装置、信息处理方法及计算机可读介质 | |
JP4192729B2 (ja) | 自由形式注釈を強調するための方法、注釈強調表示装置、及び自由形式注釈を強調するためのプログラム | |
JP7282989B2 (ja) | テキスト分類 | |
US11521404B2 (en) | Information processing apparatus and non-transitory computer readable medium for extracting field values from documents using document types and categories | |
JP7480536B2 (ja) | 文書処理装置及びプログラム | |
JPH06103411A (ja) | 文書読取装置 | |
US10990338B2 (en) | Information processing system and non-transitory computer readable medium | |
US11508139B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
US20210042555A1 (en) | Information Processing Apparatus and Table Recognition Method | |
JPH1011443A (ja) | 文書符号検査システム | |
CN114611475A (zh) | 信息处理装置、信息处理方法和计算机可读介质 | |
US8923625B2 (en) | Original image searching device, original image searching method, and computer readable medium | |
JP3190603B2 (ja) | 文字読み取り装置、その読み取り方法および記録媒体 | |
US11481447B2 (en) | Information processing device and non-transitory computer readable medium | |
US11574490B2 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
US20210295032A1 (en) | Information processing device and non-transitory computer readable medium | |
US20230266861A1 (en) | Information processing apparatus and method and non-transitory computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240229 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240326 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240408 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7480536 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |