JP2022032777A - 情報処理装置、文書管理システムおよびプログラム - Google Patents
情報処理装置、文書管理システムおよびプログラム Download PDFInfo
- Publication number
- JP2022032777A JP2022032777A JP2020136952A JP2020136952A JP2022032777A JP 2022032777 A JP2022032777 A JP 2022032777A JP 2020136952 A JP2020136952 A JP 2020136952A JP 2020136952 A JP2020136952 A JP 2020136952A JP 2022032777 A JP2022032777 A JP 2022032777A
- Authority
- JP
- Japan
- Prior art keywords
- user
- electronic document
- interest
- thumbnail
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000284 extract Substances 0.000 claims abstract description 23
- 238000000034 method Methods 0.000 claims description 116
- 230000008569 process Effects 0.000 claims description 102
- 238000012545 processing Methods 0.000 claims description 26
- 238000000605 extraction Methods 0.000 claims description 25
- 230000010365 information processing Effects 0.000 claims description 23
- 238000010586 diagram Methods 0.000 description 18
- 238000012015 optical character recognition Methods 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 7
- 238000012790 confirmation Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000013475 authorization Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
- G06F16/168—Details of user interfaces specifically adapted to file systems, e.g. browsing and visualisation, 2d or 3d GUIs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
- G06V30/1448—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/09—Recognition of logos
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Library & Information Science (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
特許文献2には、文書の編集または閲覧が終了した際に、編集情報をもとに文書テーブルとページテーブルを更新する情報処理装置が開示されている。更新後は、ユーザが決定したサムネイルの優先条件をもとに、ページテーブルの各ページの重要度を算出し、重要度の最も高いページのサムネイルを当該文書のサムネイル画像として変更する。例えば、優先条件を編集時間だけに設定した場合、編集時間が長いページから順に最も大きな数値をページテーブルの重要度にセットする。
本発明は、サムネイルの作成する際にユーザが設定を行う場合に比較して、それぞれのユーザに合わせた特徴的なサムネイルを、容易に生成することができる情報処理装置等を提供することを目的とする。
請求項2に記載の発明は、前記プロセッサは、ユーザが前記電子文書を処理する工程に応じ、前記注目領域を抽出することを特徴とする請求項1に記載の情報処理装置である。
請求項3に記載の発明は、前記プロセッサは、ユーザが前記電子文書を処理する工程に対し、ユーザが検索した対象を関連付けて前記注目領域を抽出することを特徴とする請求項2に記載の情報処理装置である。
請求項4に記載の発明は、前記プロセッサは、ユーザが前記電子文書を処理する工程に対し、ユーザが当該電子文書の画像中で文字認識させた領域を、前記注目領域として抽出することを特徴とする請求項2に記載の情報処理装置である。
請求項5に記載の発明は、前記プロセッサは、ユーザが当該電子文書の画像中で文字認識させた領域に隣接する領域を前記注目領域として抽出することを特徴とする請求項4に記載の情報処理装置である。
請求項6に記載の発明は、前記プロセッサは、文字認識の結果、キー・バリューの関係となる領域を前記注目領域として抽出することを特徴とする請求項4に記載の情報処理装置である。
請求項7に記載の発明は、前記プロセッサは、前記電子文書に応じて求められる関連度に応じ、前記サムネイルを決定することを特徴とする請求項1に記載の情報処理装置である。
請求項8に記載の発明は、前記関連度は、ユーザの属性の関連度であることを特徴とする請求項7に記載の情報処理装置である。
請求項9に記載の発明は、前記関連度は、ユーザが前記電子文書を処理する工程の関連度であることを特徴とする請求項7に記載の情報処理装置である。
請求項10に記載の発明は、ユーザの指示により、前記関連度に応じ、前記サムネイルを変更することを特徴とする請求項7に記載の情報処理装置である。
請求項11に記載の発明は、電子文書の処理を行う端末装置と、前記電子文書を管理する文書管理装置と、を備え、前記文書管理装置は、プロセッサを備え、前記プロセッサは、ユーザが過去に閲覧した電子文書の中から、ユーザが注目する領域である注目領域を抽出し、前記注目領域を基に、ユーザが閲覧する電子文書について、前記注目領域に対応した画像を抽出して、サムネイルを作成することを特徴とする文書管理システムである。
請求項12に記載の発明は、コンピュータに、ユーザが過去に閲覧した電子文書の中から、ユーザが注目する領域である注目領域を抽出する抽出機能と、前記注目領域を基に、ユーザが閲覧する電子文書について、前記注目領域に対応した画像を抽出して、サムネイルを作成する作成機能と、を実現させるためのプログラムである。
請求項2の発明によれば、電子文書が処理される工程に合わせたサムネイルを作成することができる。
請求項3、4の発明によれば、注目領域を容易に抽出することができる。
請求項5の発明によれば、ユーザが文字認識を行わなかった領域でも、注目領域とするのに適した領域を、注目領域として設定できる。
請求項6の発明によれば、ユーザにとって、さらに電子文書を識別しやすいサムネイルを作成することができる。
請求項7の発明によれば、学習モデルが構築されていないユーザに対しても、そのユーザに合わせた特徴的なサムネイルを生成することができる。
請求項8、9の発明によれば、ユーザの行う電子文書の処理に合わせたサムネイルを作成できる。
請求項10の発明によれば、ユーザにとって適していない作成されたサムネイルが作成されたときに、サムネイルの変更ができる。
請求項11の発明によれば、サムネイルの作成する際にユーザが設定を行う場合に比較して、それぞれのユーザに合わせた特徴的なサムネイルを、容易に生成することができる文書管理ステムを提供することができる。
請求項12の発明によれば、サムネイルの作成する際にユーザが設定を行う場合に比較して、それぞれのユーザに合わせた特徴的なサムネイルを、容易に生成することができる機能をコンピュータにより実現できる。
図1は、本実施の形態における文書管理システム1の構成例を示す図である。
図示する文書管理システム1は、端末装置10として、端末装置10a~10dと、文書管理サーバ20とが、ネットワーク30を介して接続されることにより構成されている。
なお、図1では、端末装置10は、4つ示しているが、その数は複数であれば、いくつであってもよい。
なお、本実施の形態で、「電子文書」とは、文字情報や画像情報を電子化したものである。この電子文書は、端末装置10および文書管理サーバ20のそれぞれで扱うことができるものであれば、形式およびデータ構造等について特に限られるものではない。本実施の形態の電子文書としては、例えば、帳票が挙げられる。帳票の具体例としては、見積書、請求書、顛末書、稟議書、申込書などである。
また、詳しくは後述するが、文書管理サーバ20は、ユーザが、処理する電子文書を選択する際に使用するサムネイルを作成する。この「サムネイル」は、画面上で電子文書を識別するための画像である。ユーザは、このサムネイルや電子文書の名称などを参照し、処理する電子文書を選択する。
さらに、端末装置10および文書管理サーバ20は、外部との通信を行うための通信インタフェース(以下、「通信I/F」と表記する)と、ビデオメモリやディスプレイ等からなる表示機構と、キーボード、マウス、タッチパネル等の入力デバイスとを備える。
図2は、文書管理サーバ20の機能構成例について説明したブロック図である。
なおここでは、文書管理システム1が有する種々の機能のうち本実施の形態に関係するものを選択して図示している。
認証部22は、予め定められた方法で、ユーザの認証を行う。認証部22は、例えば、ユーザから送られたユーザIDおよびパスワードと、記憶部28に記憶されているユーザIDおよびパスワードとを比較する。その結果、両者が合致すれば、ユーザを認証する。
本実施の形態で、「注目領域」は、電子文書が処理される各プロセスにおいて、ユーザが処理を行うために必要な領域であり、ユーザが確認したい対象となる領域である。即ち、ユーザは、電子文書の中で、自らが行うプロセスに関する領域を電子文書の中から見つけ出し、この領域に対し処理を行う。つまりこの領域は、ユーザが注目する領域であると言える。
ここで、「関連度」は、複数の文言の類似の度合いを表すパラメータである。具体的には、関連度算出部25は、ユーザの属性名の類似度からユーザの属性の関連度を算出する。例えば、ユーザの属性名が、「請求振分け担当者」と「請求書担当者」とでは、類似度が高く、ユーザの属性の関連度は、高くなる。対して、ユーザの属性名が、「請求振分け担当者」と「文書管理担当者」とでは、類似度が低く、ユーザの属性の関連度は、低くなる。また、処理の履歴により、類似の電子文書で、類似の項目を処理するような場合は、ユーザの属性の関連度を、高くすることもできる。
関連度算出部25が、ユーザの属性の関連度やプロセスの関連度を算出するには、既存の手法を用いることができる。例えば、Word2vecを用いることで、これらの関連度を算出できる。関連度は、例えば、01~10の10段階で定めることができる。この場合、01は、関連度が最も低く、10は、関連度が最も高いことを意味する。
対して、それぞれの電子文書が容易に識別できず、必要な電子文書を容易に識別することができなければ、変更の指示をする。この場合は、学習モデルに基づき、サムネイル作成部26は、他のサムネイルを作成する。
認証部22、注目領域抽出部23、学習モデル作成部24、関連度算出部25、サムネイル作成部26、確認部27は、例えば、CPUに対応する。
次に、文書管理サーバ20が、サムネイルを作成する手順について、さらに詳細に説明する。ここでは、以下の実施例1および実施例2により、文書管理サーバ20が、サムネイルを作成する手順について具体的に説明する。
図3~図6は、実施例1で、サムネイルを作成する手順について示した図である。
実施例1では、文書管理サーバ20の注目領域抽出部23は、プロセスに対し、ユーザが検索した対象を関連付けて注目領域を抽出する。
ここでは、電子文書D1や電子文書D2が、画像として端末装置10に表示され、これを見たユーザが電子文書の処理を行う場合を示している。さらにここでは、ユーザの属性が、請求振分け担当者であり、プロセスが、請求書の振分けであった場合の注目領域C1について示している。
この場合、注目領域C1は、請求書の振分けに必要な領域となり、例えば、企業ロゴや企業名となる。即ち、この場合の注目領域C1は、電子文書D1では、企業ロゴK1となり、電子文書D2では、「〇◇△株式会社」となる。
図示する学習モデルでM1では、文書名、ユーザの属性、プロセス、関連情報が関連付けられて学習される。このうち「文書名」は、上述した電子文書D1や電子文書D2に付与される名称である。また、「関連情報」は、注目領域抽出部23で抽出された注目領域C1が格納される。さらに、「ユーザの属性」および「プロセス」は、それぞれ上述したユーザの属性およびプロセスである。
上述したように、サムネイル作成部26は、電子文書に応じて求められる関連度に応じ、ユーザに提示するサムネイルを決定する。ここで、図4(a)に示した学習モデルM1のユーザの属性は、「請求振分け担当者」である。
これに対し、他のユーザの属性が、「請求書担当者」であった場合は、ユーザの属性の名称が類似であり、関連度は高い。ここでは、関連度算出部25で、ユーザの関連度として、「09」が算出されたことを図示している。この場合、他のユーザである「請求書担当者」に提示するサムネイルは、「請求振分け担当者」のサムネイルと同じものとすることが好ましい。
一方、他のユーザの属性が、「文書管理担当者」であった場合は、ユーザの属性の名称が類似でなく、関連度は低い。ここでは、関連度算出部25で、ユーザの関連度として、「03」が算出されたことを図示している。この場合、他のユーザである「文書管理担当者」に提示するサムネイルは、「請求振分け担当者」のサムネイルと同じものとしないことが好ましい。
ここでは、電子文書D1や電子文書D2が、画像として端末装置10に表示され、これを見たユーザが電子文書の処理を行う場合を示している。さらにここでは、ユーザの属性が、請求書監査担当者であり、プロセスが、請求日のチェックであった場合の注目領域C2について示している。
この場合、注目領域C2は、請求日のチェックに必要な領域となり、例えば、請求日になる。即ち、この場合の注目領域C2は、電子文書D1では、「2020/1/31」となり、電子文書D2では、「2019/12/31」となる。
図示する学習モデルM2では、図4(a)の場合と同様に、文書名、ユーザの属性、プロセス、関連情報が関連付けられて学習される。ここでは、「関連情報」として、注目領域抽出部23で抽出された注目領域C2が格納される。
ここで、図6(a)に示した学習モデルM2のユーザの属性は、「請求書監査担当者」である。
これに対し、他のユーザの属性が、「文書編集者」であった場合は、ユーザの属性の名称が類似でなく、関連度は低い。ここでは、関連度算出部25で、ユーザの関連度として、「03」が算出されたことを図示している。一方、このユーザのプロセスが、「請求日確認」であった場合は、プロセスの名称が類似であり、関連度は高い。ここでは、関連度算出部25で、プロセスの関連度として、「09」が算出されたことを図示している。この場合、このユーザに対するユーザの属性は、低いものの、このユーザに対するプロセスの関連度は高い。よって、このユーザに提示するサムネイルは、「請求書監査担当者」のサムネイルと同じものとすることが好ましい。
図7~図11は、実施例2で、サムネイルを作成する手順について示した図である。
実施例2では、文書管理サーバ20の注目領域抽出部23は、ユーザが電子文書を処理するプロセスに対し、ユーザが電子文書の画像中で文字認識させた領域を、注目領域として抽出する。
ここでは、電子文書D1や電子文書D2が、画像として端末装置10に表示され、これを見たユーザが電子文書の処理を行う場合を示している。さらにここでは、ユーザの属性が、請求振分け担当者であり、プロセスが、請求書のOCR(Optical character recognition:光学文字認識)であった場合の注目領域C1について示している。なお、OCRを行うアプリケーションソフトウェアは、上述したプロセスを実行するアプリケーションソフトウェアに内蔵されていてもよく、他のアプリケーションソフトウェアであってもよい。
この場合、注目領域C1は、請求書のOCRに必要な領域となり、例えば、企業ロゴや企業名となる。即ち、この場合の注目領域C1は、電子文書D1では、企業ロゴK1となり、電子文書D2では、「〇◇△株式会社」となる。
図示する学習モデルM3では、図4(a)の場合と同様に、文書名、ユーザの属性、プロセス、関連情報が関連付けられて学習される。ただし、図4(a)と異なり、ここでは、「プロセス」として、「請求書のOCR」が格納される。
ここでは、電子文書D1や電子文書D2が、画像として端末装置10に表示され、これを見たユーザが電子文書の処理を行う場合を示している。さらにここでは、ユーザの属性が、請求書監査担当者であり、プロセスが、請求日のチェックであった場合の注目領域C2について示している。
この場合、注目領域C2は、請求日のチェックに必要な領域となり、例えば、KEY値の対するValue値になる。ここで、「KEY値」は、電子文書の中で、予め定められた書式の値を要求する項目であり、「Value値」は、KEY値に対する値である。即ち、この場合の注目領域C2は、電子文書D1では、KEY値である「請求日」に対する、Value値である「2020/1/31」となり、電子文書D2では、「2019/12/31」となる。
この場合、例えば、ユーザは、電子文書D1や電子文書D2に対し、請求日の箇所にOCRを行う。そして、注目領域抽出部23は、OCRを行った「請求日」のValue値の文字列を注目領域C2とする。即ち、注目領域抽出部23は、ユーザが電子文書の画像中で文字認識させた領域に隣接する領域を注目領域C2として抽出する。ここでは、Value値として、「2020/1/31」や「2019/12/31」を注目領域C2とする。なお、図9では、この隣接する箇所の文字列について、マウスOCR周辺語として図示している。
ここでは、電子文書D1や電子文書D2が、画像として端末装置10に表示され、これを見たユーザが電子文書の処理を行う場合を示している。さらにここでは、ユーザの属性が、請求書監査担当者であり、プロセスが、請求日のチェックであった場合の注目領域C3について示している。
この場合、注目領域C3は、請求日のチェックに必要な領域となり、例えば、請求日のKEY値およびそのValue値になる。即ち、この場合の注目領域C3は、電子文書D1では、「請求日 2020/1/31」となり、電子文書D2では、「請求日 2019/12/31」となる。この場合、「請求日」が、KEY値であり、「2020/1/31」および「2019/12/31」が、KEY値に対するそのValue値になる。即ち、注目領域抽出部23は、文字認識の結果、キー(KEY値)・バリュー(Value値)の関係となる領域を注目領域C3として抽出する。
図示する学習モデルM4では、図5(a)の場合と同様に、文書名、ユーザの属性、プロセス、関連情報が関連付けられて学習される。ただしここでは、「関連情報」として、注目領域抽出部23で抽出された注目領域C3が格納される。
ここでは、フォルダXYZを開いたときに、フォルダXYZに格納される電子文書について、サムネイルを表示して場合を示している。
このうち、図12(a)は、図4(a)の学習モデルM1や図8の学習モデルM3を基に作成されるサムネイルを示している。図示するサムネイルS1は、学習モデルM1の関連情報をサムネイルとしたものである。
また、図12(b)は、図6(a)の学習モデルM2を基に作成されるサムネイルを示している。図示するサムネイルS2は、学習モデルM2の関連情報をサムネイルとしたものである。
さらに、図12(c)は、図11の学習モデルM4を基に作成されるサムネイルを示している。図示するサムネイルS3は、学習モデルM4の関連情報をサムネイルとしたものである。
図13は、文書管理サーバ20の動作について説明したフローチャートである。
まず、端末装置10から文書管理サーバ20に対し、ユーザが認証を行う(ステップ101)。認証は、認証部22により行われる。
次に、送受信部21は、認証したユーザが、過去に電子文書の処理を行ったユーザであり、学習モデルが存在するか否かを判断する(ステップ102)。
その結果、学習モデルが存在する場合(ステップ102でYes)、サムネイル作成部26が、学習モデルに基づきサムネイルを作成し、ユーザに対し提示する(ステップ103)。
その結果、類似し、関連度が高いユーザの属性が存在した場合(ステップ104でYes)、サムネイル作成部26は、この類似するユーザの属性に対応する学習モデルに基づきサムネイルを作成し、ユーザに対し提示する(ステップ103)。
その結果、類似し、関連度が高いプロセスが存在した場合(ステップ105でYes)、サムネイル作成部26は、この類似するプロセスに対応する学習モデルに基づきサムネイルを作成し、ユーザに対し提示する(ステップ103)。
そして、最も関連度が高い場合に対応する学習モデルに基づきサムネイルを作成し、ユーザに対し提示する(ステップ103)。
その結果、適していない場合(ステップ107でNo)、ユーザは、サムネイルの再作成の指示を出す(ステップ108)。
このとき、サムネイル作成部26では、再び学習モデルに基づきサムネイルを作成し、ユーザに対し提示する(ステップ109)。
この場合、サムネイル作成部26は、他のユーザの関連度や他のユーザのプロセスの関連度に基づき、サムネイルを再作成する。即ち、サムネイル作成部26は、ユーザの指示により、関連度に応じ、サムネイルを変更する。具体的には、サムネイル作成部26は、これらの類似度が高く、関連度が高い場合の学習モデルに基づき、サムネイルを作成し、ユーザに対し提示する。また、再作成の指示が複数回なされたときは、これらの類似度が高く、関連度が高い方から順にサムネイルを作成し、ユーザに対し提示する。
選択された電子文書は、文書管理サーバ20の記憶部28から取得され、ユーザは、電子文書の処理を行う(ステップ111)。このとき行う処理は、例えば、電子文書の画像に対し、抽出、参照、検索等を行う処理である。
そして、学習モデル作成部24が、注目領域抽出部23が抽出した注目領域を基に、学習モデル作成部24が学習モデルを作成する(ステップ113)。作成された学習モデルは、記憶部28に保存される。
ユーザは、電子文書の処理が終了すると、処理後の電子文書を保存する。処理後の電子文書は、文書管理サーバ20の記憶部28に保存される(ステップ114)。
また、サムネイルの作成は、いわば自動的になされ、ユーザが手動でサムネイルを作成するための項目を設定する必要がない。
ここで、以上説明を行った本実施の形態の文書管理サーバ20で行う処理は、例えば、ソフトウェア等のプログラムとして用意される。そして、ソフトウェアとハードウェア資源とが協働することにより実現される。
Claims (12)
- プロセッサを備え、
前記プロセッサは、
ユーザが過去に閲覧した電子文書の中から、ユーザが注目する領域である注目領域を抽出し、
前記注目領域を基に、ユーザが閲覧する電子文書について、前記注目領域に対応した画像を抽出して、サムネイルを作成する
ことを特徴とする情報処理装置。 - 前記プロセッサは、ユーザが前記電子文書を処理する工程に応じ、前記注目領域を抽出することを特徴とする請求項1に記載の情報処理装置。
- 前記プロセッサは、ユーザが前記電子文書を処理する工程に対し、ユーザが検索した対象を関連付けて前記注目領域を抽出することを特徴とする請求項2に記載の情報処理装置。
- 前記プロセッサは、ユーザが前記電子文書を処理する工程に対し、ユーザが当該電子文書の画像中で文字認識させた領域を、前記注目領域として抽出することを特徴とする請求項2に記載の情報処理装置。
- 前記プロセッサは、ユーザが当該電子文書の画像中で文字認識させた領域に隣接する領域を前記注目領域として抽出することを特徴とする請求項4に記載の情報処理装置。
- 前記プロセッサは、文字認識の結果、キー・バリューの関係となる領域を前記注目領域として抽出することを特徴とする請求項4に記載の情報処理装置。
- 前記プロセッサは、前記電子文書に応じて求められる関連度に応じ、前記サムネイルを決定することを特徴とする請求項1に記載の情報処理装置。
- 前記関連度は、ユーザの属性の関連度であることを特徴とする請求項7に記載の情報処理装置。
- 前記関連度は、ユーザが前記電子文書を処理する工程の関連度であることを特徴とする請求項7に記載の情報処理装置。
- ユーザの指示により、前記関連度に応じ、前記サムネイルを変更することを特徴とする請求項7に記載の情報処理装置。
- 電子文書の処理を行う端末装置と、
前記電子文書を管理する文書管理装置と、
を備え、
前記文書管理装置は、プロセッサを備え、
前記プロセッサは、
ユーザが過去に閲覧した電子文書の中から、ユーザが注目する領域である注目領域を抽出し、
前記注目領域を基に、ユーザが閲覧する電子文書について、前記注目領域に対応した画像を抽出して、サムネイルを作成する
ことを特徴とする文書管理システム。 - コンピュータに、
ユーザが過去に閲覧した電子文書の中から、ユーザが注目する領域である注目領域を抽出する抽出機能と、
前記注目領域を基に、ユーザが閲覧する電子文書について、前記注目領域に対応した画像を抽出して、サムネイルを作成する作成機能と、
を実現させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020136952A JP2022032777A (ja) | 2020-08-14 | 2020-08-14 | 情報処理装置、文書管理システムおよびプログラム |
US17/168,181 US20220051007A1 (en) | 2020-08-14 | 2021-02-05 | Information processing apparatus, document management system, and non-transitory computer readable medium |
CN202110236974.XA CN114077585A (zh) | 2020-08-14 | 2021-03-03 | 信息处理装置与方法、文档管理系统以及计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020136952A JP2022032777A (ja) | 2020-08-14 | 2020-08-14 | 情報処理装置、文書管理システムおよびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022032777A true JP2022032777A (ja) | 2022-02-25 |
Family
ID=80224334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020136952A Pending JP2022032777A (ja) | 2020-08-14 | 2020-08-14 | 情報処理装置、文書管理システムおよびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220051007A1 (ja) |
JP (1) | JP2022032777A (ja) |
CN (1) | CN114077585A (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6519603B1 (en) * | 1999-10-28 | 2003-02-11 | International Business Machine Corporation | Method and system for organizing an annotation structure and for querying data and annotations |
US8713418B2 (en) * | 2004-04-12 | 2014-04-29 | Google Inc. | Adding value to a rendered document |
JP5962277B2 (ja) * | 2012-07-12 | 2016-08-03 | 富士ゼロックス株式会社 | 文書関連付け装置及びプログラム |
JP6828508B2 (ja) * | 2017-02-27 | 2021-02-10 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
CN108921221B (zh) * | 2018-07-04 | 2022-11-18 | 腾讯科技(深圳)有限公司 | 用户特征的生成方法、装置、设备及存储介质 |
-
2020
- 2020-08-14 JP JP2020136952A patent/JP2022032777A/ja active Pending
-
2021
- 2021-02-05 US US17/168,181 patent/US20220051007A1/en active Pending
- 2021-03-03 CN CN202110236974.XA patent/CN114077585A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220051007A1 (en) | 2022-02-17 |
CN114077585A (zh) | 2022-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7814134B2 (en) | System and method for providing integrated management of electronic information | |
US8095541B2 (en) | Managing electronic data with index data corresponding to said electronic data | |
JP5023715B2 (ja) | 情報処理システム、情報処理装置及びプログラム | |
AU2001220184A1 (en) | A system and method for providing integrated management of electronic information | |
JP6032138B2 (ja) | プログラム、文書提供装置及び文書表示システム | |
US20230237255A1 (en) | Form generation method, apparatus, and device, and medium | |
US20060265762A1 (en) | Server apparatus and control method | |
CN104919452A (zh) | 使用图像来改善人搜索 | |
US20030065647A1 (en) | Server apparatus, communication terminal, and control methods therefor | |
JP5572990B2 (ja) | 電子データを管理するシステム、装置及び方法 | |
CN112860642A (zh) | 一种庭审数据处理方法、服务器及终端 | |
US7899781B1 (en) | Method and system for synchronizing a local instance of legal matter with a web instance of the legal matter | |
JP4008679B2 (ja) | 情報管理装置及び情報管理システム | |
US20090300001A1 (en) | Server apparatus, catalog processing method, and computer-readable storage medium | |
US11354492B2 (en) | EDOC utility using non-structured-query-language databases | |
JP2012159917A (ja) | 文書管理システム、文書管理方法、及びプログラム | |
JP5835224B2 (ja) | 入力支援プログラム、入力支援装置、及び入力支援方法 | |
US11023418B2 (en) | Keyword-based data management system and method | |
US7100126B2 (en) | Electrical form design and management method, and recording medium | |
JP2022032777A (ja) | 情報処理装置、文書管理システムおよびプログラム | |
JP7298208B2 (ja) | 情報処理装置及びプログラム | |
CN110413366B (zh) | 一种基于区块链的截屏方法、装置、设备及存储介质 | |
US20230385527A1 (en) | Computer system and method for presenting forensic data in a user interface based on hash lists and generating hash lists therefor | |
JP5320306B2 (ja) | ファイル検索システムならびにファイル・サーバ,その動作制御方法およびその動作プログラム | |
JP7421859B2 (ja) | 作成支援装置および作成支援方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240305 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240313 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240424 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240528 |