JP2018151854A - 文書処理装置およびプログラム - Google Patents

文書処理装置およびプログラム Download PDF

Info

Publication number
JP2018151854A
JP2018151854A JP2017047551A JP2017047551A JP2018151854A JP 2018151854 A JP2018151854 A JP 2018151854A JP 2017047551 A JP2017047551 A JP 2017047551A JP 2017047551 A JP2017047551 A JP 2017047551A JP 2018151854 A JP2018151854 A JP 2018151854A
Authority
JP
Japan
Prior art keywords
document
unit
image
keyword
keyword extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017047551A
Other languages
English (en)
Inventor
健児 黒石
Kenji Kuroishi
健児 黒石
千種 仲田
Chigusa Nakata
千種 仲田
本田 裕
Yutaka Honda
裕 本田
西 栄治
Eiji Nishi
栄治 西
関根 義寛
Yoshihiro Sekine
義寛 関根
洋 御厨
Hiroshi Mikuriya
洋 御厨
健 古谷
Takeshi Furuya
健 古谷
隆一 石塚
Ryuichi Ishizuka
隆一 石塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2017047551A priority Critical patent/JP2018151854A/ja
Priority to US15/783,099 priority patent/US10477043B2/en
Publication of JP2018151854A publication Critical patent/JP2018151854A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】オフィスや社内等でやり取りされる文書から重要なキーワードを精度よく抽出できるようにする。【解決手段】電子化されていない画像を処理する画像処理部と、画像処理部の処理対象である画像をキーワード抽出の対象とするか否かを判定する対象判定部61と、画像処理部の処理対象である画像からテキストを読み取るテキスト読み取り部62と、対象判定部61によりキーワード抽出の対象と判定された画像を対象としてテキスト読み取り部62により読み取られたテキストからキーワードを抽出するキーワード抽出部63と、を備える。【選択図】図3

Description

本発明は、文書処理装置およびプログラムに関する。
文書データを解析してキーワードを抽出する従来技術がある。特許文献1には、ネットワーク上で公開されているテキストや電子メールで配信されたテキストから単語を抽出し、抽出した各単語の出現頻度に応じてキーワードとして保持する装置が開示されている。
特開2014−182741号公報
オフィスや社内等で関心を持たれている事柄を調べる手段として、オフィスや社内でやり取りされる文書からキーワードを抽出して検討することが考えられる。しかし、今日、オフィス等には電子メール等の電子化された文書を含む大量の文書がやり取りされているため、これらを無選別に対象としてキーワードの抽出を行うと、重要でない単語をキーワードとして抽出してしまうことも多い。
本発明は、オフィスや社内等でやり取りされる文書から重要なキーワードを精度よく抽出できるようにすることを目的とする。
本発明の請求項1に係る文書処理装置は、
画像を処理する画像処理部と、
前記画像処理部の処理対象である画像をキーワード抽出の対象とするか否かを判定する対象判定部と、
前記画像処理部の処理対象である画像からテキストを読み取るテキスト読み取り部と、
前記対象判定部によりキーワード抽出の対象と判定された画像を対象として前記テキスト読み取り部により読み取られたテキストからキーワードを抽出するキーワード抽出部と、
を備えることを特徴とする、文書処理装置である。
本発明の請求項2に係る文書処理装置は、
前記対象判定部は、前記テキスト読み取り部により読み取られたテキストに、予め定められた特定文字が含まれているか否かに応じて、キーワード抽出を行うか否かを判定することを特徴とする、請求項1に記載の文書処理装置である。
本発明の請求項3に係る文書処理装置は、
前記対象判定部は、前記特定文字が前記画像から読み取られたテキストに含まれている場合であっても、当該特定文字が予め定められた特定の態様で前記画像に記録されている場合は、当該特定の態様以外の態様で記録されている場合とは異なる判定結果とすることを特徴とする、請求項2に記載の文書処理装置である。
本発明の請求項4に係る文書処理装置は、
前記対象判定部は、前記画像処理部によって行われる処理の種類に応じて特定される判定条件に基づき、前記画像をキーワード抽出の対象とするか否かを判定することを特徴とする、請求項1乃至請求項3のいずれかに記載の文書処理装置である。
本発明の請求項5に係る文書処理装置は、
前記キーワード抽出部は、前記画像処理部によって行われる処理の種類に応じて特定される抽出条件に基づき、キーワードを抽出することを特徴とする、請求項1乃至請求項4のいずれかに記載の文書処理装置である。
本発明の請求項6に係る文書処理装置は、
前記キーワード抽出部は、前記画像処理部によって行われる処理の種類に応じて、抽出されたキーワードに対して重み付けを行うことを特徴とする、請求項1乃至請求項5のいずれかに記載の文書処理装置である。
本発明の請求項7に係る文書処理装置は、
画像処理部に処理を実行させる操作者を認証する認証手段をさらに備え、
前記キーワード抽出部は、前記認証手段による認証により特定された操作者に応じて、抽出されたキーワードに対して重み付けを行うことを特徴とする、請求項1乃至請求項5のいずれかに記載の文書処理装置である。
本発明の請求項8に係る文書処理装置は、
処理対象の画像を取得するために用いられるインターフェイスを複数備え、
前記キーワード抽出部は、複数の前記インターフェイスのうち、キーワードの抽出対象となった画像の取得に用いられたインターフェイスの種類に応じて、抽出されたキーワードに対して重み付けを行うことを特徴とする、請求項1乃至請求項5のいずれかに記載の文書処理装置である。
本発明の請求項9に係る文書処理装置は、
前記キーワード抽出部により抽出されたキーワードの情報を管理する管理部と、
他の文書処理装置とデータ交換を行うための通信部と、をさらに備え、
前記管理部は、前記通信部を介して、他の文書処理装置により抽出されたキーワードの情報を取得し、自装置のキーワード抽出部により抽出されたキーワードの情報と共に管理することを特徴とする、請求項1乃至請求項8のいずれかに記載の文書処理装置である。
本発明の請求項10に係るプログラムは、
コンピュータを制御し、
画像を処理する画像処理手段と、
前記画像処理手段の処理対象である画像をキーワード抽出の対象とするか否かを判定する対象判定手段と、
前記画像処理手段の処理対象である画像からテキストを読み取るテキスト読み取り手段と、
前記対象判定手段によりキーワード抽出の対象と判定された画像を対象として前記テキスト読み取り手段により読み取られたテキストからキーワードを抽出するキーワード抽出手段として、
前記コンピュータを機能させることを特徴とする、プログラムである。
請求項1の発明によれば、電子メール等の電子化された文書を対象としてキーワード抽出を行う場合と比較して、キーワード抽出を精度よく行うことができる。
請求項2の発明によれば、文書処理の対象となる全ての文書をキーワード抽出の対象とする場合と比較して、文書に特定文字が含まれているか否かに基づいてキーワード抽出の対象とする文書の選別を行うことにより、より精度よくキーワード抽出を行うことができる。
請求項3の発明によれば、特定文字が含まれる全ての文書をキーワード抽出の対象とする場合と比較して、文書における特定文字の態様に応じてキーワード抽出の対象とする文書の選別を行うことにより、さらに精度よくキーワード抽出を行うことができる。
請求項4の発明によれば、文書処理の対象となる全ての文書をキーワード抽出の対象とする場合と比較して、文書に対して行われる文書処理に応じて文書をキーワード抽出の対象とするか否かについての判定を行うことにより、さらに精度よくキーワード抽出を行うことができる。
請求項5の発明によれば、文書処理の対象となる全ての文書に対して同じ条件でキーワード抽出を行う場合と比較して、文書に対して行われる文書処理に応じて特定される抽出条件でキーワード抽出を行うことにより、さらに精度よくキーワード抽出を行うことができる。
請求項6の発明によれば、抽出されたキーワードに対する重み付けを行わない場合と比較して、文書に対して行われる文書処理に応じて特定される条件で、抽出されたキーワードに重み付けを行うことにより、さらに精度よくキーワード抽出を行うことができる。
請求項7の発明によれば、抽出されたキーワードに対する重み付けを行わない場合と比較して、文書処理装置の操作者に応じて特定される条件で、抽出されたキーワードに重み付けを行うことにより、さらに精度よくキーワード抽出を行うことができる。
請求項8の発明によれば、抽出されたキーワードに対する重み付けを行わない場合と比較して、文書の取得に用いられたインターフェイスの種類に応じて特定される条件で、抽出されたキーワードに重み付けを行うことにより、さらに精度よくキーワード抽出を行うことができる。
請求項9の発明によれば、個別の文書処理装置ごとにキーワードを抽出する場合と比較して、抽出したキーワードの情報を他の文書処理装置と共有することにより、より多くの文書からキーワードを抽出することができる。
請求項10の発明によれば、電子メール等の電子化された文書を対象としてキーワード抽出を行う場合と比較して、本発明のプログラムを実行するコンピュータにおいて、電子化されていない画像としての文書を抽出対象として、キーワード抽出を精度よく行うことができる。
本実施形態が適用されるキーワード抽出システムの構成を示す図である。 文書処理装置の一例としての複合機の機能構成を示す図である。 制御部の機能構成を示した図である。 文書における特定文字の態様を説明する図であり、図4(A)は、文書の位置づけを示す特定文字の態様の例を示す図、図4(B)は、文書の内容において特定文字に相当する単語が用いられている例を示す図である。 特定文字に基づいてキーワード抽出の対象の判定を行う場合の対象判定部およびテキスト読み取り部の動作を示すフローチャートである。
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
<本実施形態が適用されるシステム>
図1は、本実施形態が適用されるキーワード抽出システム10の構成を示す図である。図1に示すように、本実施形態のキーワード抽出システム10は、文書を処理してキーワードを抽出する文書処理装置100と、抽出されたキーワードを管理するキーワード管理サーバ200とを備える。
本実施形態において、「文書」とは、コンピュータが扱える文字コードで表現されていない(言い換えれば、テキストデータとして記述されていない)文書とする。具体的には、例えば、紙などの媒体にトナー等の画像形成材を用いて印字された文書や手書きの文書などである。また、文字が画像として記録されている電子データも、本実施形態の「文書」であるものとする。特に、コンピュータが扱える文字コードで表現された文書と区別する場合には、「テキストデータ以外の形式の文書」や「電子化されていない文書」等と呼ぶ。また、コンピュータが扱える文字コードで表現された文書については、「電子文書」や「電子化された文書」等と呼ぶ。
文書処理装置100は、文書からキーワードを抽出する装置である。この文書処理装置100は、文書をテキストデータ以外の形式で扱う機能を有する(以下、この種の機能による文書に対する処理を「文書処理」と呼ぶ場合がある)。文書処理装置100の例としては、プリンタ、スキャナ、コピー機、ファクシミリ装置や、これらの機能を複合的に備えた複合機、画像を投影するプロジェクタ等が挙げられる。すなわち、文書処理装置100の主要な例は、画像化された文書(媒体上に形成された画像や電子化された画像データを含む)を処理する画像処理装置である。また、文書処理装置100は、文書を解析してキーワードを抽出するのに伴って関連情報(例えば、キーワードを含む文書の種類や数、文書の種類ごとのキーワードの出現頻度など)を取得し、抽出したキーワードと共にキーワード管理サーバ200へ送信する。
キーワード管理サーバ200は、コンピュータにて実現される。キーワード管理サーバ200には、1または複数の文書処理装置100が接続される。そして、文書処理装置100において抽出されたキーワードおよび関連情報を受信して管理する。図1に示す構成において、キーワード管理サーバ200と文書処理装置100とは、ネットワーク300により接続されている。ネットワーク300は、装置間のデータ通信に用いられる通信ネットワークであれば特に限定されず、例えばインターネット、LAN(Local Area Network)、WAN(Wide Area Network)等としてよい。すなわち、キーワード管理サーバ200は、LAN上に構築されたローカルなサーバであってもよいし、インターネット上に構築されたいわゆるクラウドサーバであってもよい。また、文書処理装置100の一つをキーワード管理サーバ200として機能させてもよい。データ通信に用いられる通信回線は、有線であっても無線であっても良い。また、複数のネットワークや通信回線を介して各装置を接続するように構成してもよい。
図2は、文書処理装置100の一例としての複合機の機能構成を示す図である。図2に示す構成において、文書処理装置100は、制御部60を構成するCPU(Central Processing Unit)102と、ROM(Read Only Memory)103と、RAM(Random Access Memory)104とを備える。また、文書処理装置100は、記憶部105と、操作部106と、表示部107と、画像読み取り部108と、画像形成部109と、通信部110と、画像処理部111と、認証処理部112とを備える。これらの各機能部は、バス101に接続され、このバス101を介してデータの授受を行う。
操作部106は、ユーザ(操作者)の操作を受け付ける。操作部106は、例えば、ハードウェアキーにより構成される。また、例えば、押圧された位置に応じた制御信号を出力するタッチセンサにより構成される。タッチセンサと後述の表示部107を構成する液晶ディスプレイとを組み合わせたタッチパネルとして構成しても良い。
表示部107は、表示手段の一例であり、例えば液晶ディスプレイにより構成される。この表示部107は、CPU102の制御の下、文書処理装置100に関する情報を表示する。また、表示部107は、ユーザが文書処理装置100を操作する際にユーザが参照するメニュー画面を表示する。すなわち、上記の操作部106と表示部107とを組み合わせて、文書処理装置100のユーザインタフェース部として機能する。また、本実施形態において、表示部107は、後述する表示制御部64の制御により、キーワードの情報を表示する。
画像読み取り部108は、いわゆるスキャナ装置により構成され、文書処理の一つとして、セットされた原稿上の画像を光学的に読み取り、読み取り画像(画像データ)を生成する。画像の読み取り方式としては、例えば、光源から原稿に照射した光に対する反射光をレンズで縮小してCCD(Charge Coupled Devices)で受光するCCD方式や、LED(Light Emitting Diode)光源から原稿に順に照射した光に対する反射光をCIS(Contact Image Sensor)で受光するCIS方式が用いられる。
画像形成部109は、画像形成手段の一例であり、文書処理の一つとして、記録材の一例である用紙に対して、画像形成材を用いて画像データに基づく画像を形成する。記録材に画像を形成する方式としては、例えば、感光体に付着させたトナーを記録材に転写して像を形成する電子写真方式や、インクを記録材上に吐出して像を形成するインクジェット方式等が用いられる。
通信部110は、ネットワーク300を介してキーワード管理サーバ200や他の文書処理装置100に接続するためのネットワーク・インターフェイスを有している。また、通信部110は、文書処理の一つとして、ファクシミリによる送受信を行うための電話回線への接続機能も有している。
画像処理部111は、演算手段であるプロセッサと作業用メモリとを備え、画像データが表す画像に色補正や階調補正等の画像処理を施す。なお、プロセッサとして制御部60のCPU102を、作業用メモリとして制御部60のRAM104を、それぞれ兼用しても良い。
認証処理部112は、文書処理装置100の機能を利用する操作者を認証する。認証手段は特に限定しない。例えば、文書処理装置100の筐体にICカードの読み取り機能を設け、操作者のID情報(識別情報)を記録したICカードを読み取って認証処理を行ってもよいし、操作者が操作部106を操作して入力したID情報に基づき認証処理を行うようにしてもよい。また、操作者が外部装置から遠隔制御により文書処理装置100を操作する場合は、外部装置から文書処理装置100にアクセスする際に入力させた認証情報を用いて認証処理を行ってもよい。その他、既存の種々の認証手法を適用してよい。なお、認証処理部112の機能は、制御部60のCPU102が、制御部60のROM103に格納されているプログラムを実行することにより実現してもよい。
記憶部105は、記憶手段の一例であり、例えば、ハードディスク装置などの記憶装置により構成される。記憶部105は、画像読み取り部108にて生成された読み取り画像等の画像データを記憶する。さらに、本実施形態の記憶部105は、上述した文書処理の対象である文書から抽出されたキーワードの情報を保持するキーワード情報保持部として機能する。
制御部60を構成するCPU102、ROM103およびRAM104において、ROM103は、CPU102により実行されるプログラムを記憶する。CPU102は、ROM103に記憶されているプログラムを読み出し、RAM104を作業エリアにして、プログラムを実行する。また、記憶部105に格納されたプログラムをRAM104に読み込んで、RAM104に読み込んだプログラムをCPU102が実行するようにしても良い。CPU102は、プログラムを実行することにより、制御部60として、文書処理装置100の各機能部を制御する。また、本実施形態では、制御部60が、文書からキーワードを抽出して管理するための機能を実現する。
<制御部の機能構成>
図3は、制御部60の機能構成を示した図である。対象判定部61、テキスト読み取り部62、キーワード抽出部63、表示制御部64、通信制御部65、キーワード情報管理部66および認証部67は、ソフトウェアとハードウェア資源とが協働することにより実現される。具体的には、本実施形態では、ROM103(図2参照)や記憶部105に、オペレーティングシステムおよびオペレーティングシステムと協働して実行されるアプリケーションプログラムが記憶されている。そして、本実施形態では、CPU102が、これらのプログラムをROM103等から主記憶装置であるRAM104に読み込み、実行することで、対象判定部61、テキスト読み取り部62、キーワード抽出部63、表示制御部64、通信制御部65、キーワード情報管理部66、認証部67として機能する。
ここで、CPU102によって実行されるプログラムは、磁気記録媒体(磁気ディスクなど)、光記録媒体(光ディスクなど)、半導体メモリなどのコンピュータが読取可能な記録媒体に記憶した状態で、文書処理装置100へ提供し得る。また、CPU102によって実行されるプログラムは、インターネットなどのネットワークを介して文書処理装置100に提供するようにしてもよい。
対象判定部61は、文書処理装置100により処理(文書処理)される文書を対象として、キーワード抽出の対象とするか否かを判定する。言い換えると、予め定められた条件(判定条件)に基づき、キーワード抽出の対象となる文書を除外する。対象判定部61は、文書の内容、文書の記録形態や記録された媒体の種類、文書に対する処理(文書処理)の種類等に応じて、種々の手法により、文書をキーワード抽出の対象とするか否かを判定する。具体的な判定手法については後述する。
テキスト読み取り部62は、対象判定部61により選別された文書を読み取り、キーワード抽出を行うためのテキストデータを生成する。言い換えれば、電子化されていない文書を電子化された文書に変換する。文書処理装置100により行われる文書処理が文書画像の読み取りである場合、処理対象の文書は、紙などの媒体上に形成されている。この場合、例えば、OCR(Optical Character Recognition/Reader、光学的文字認識)処理により媒体上に形成された文書を読み取る。また、文書処理装置100により行われる文書処理が、文字が画像として記録されている電子データに基づく印刷出力等である場合、例えば、メモリ上に展開した画像に対して文字認識処理を行って文書を読み取る。また、文書処理装置100により行われる文書処理が、PDL(Page Description Language)で記述された電子文書の印刷出力等である場合は、PDLで記述された電子文書にはテキストデータが含まれている。そこで、この場合は、直接テキストデータを抽出すればよい。その他、文書における文字の記録方式に応じて、既存の種々の手法を用いてテキストデータを生成してよい。
キーワード抽出部63は、対象判定部61によりキーワード抽出の対象と判定された文書を対象として、テキスト読み取り部62により生成されたテキストデータに基づきキーワードを抽出する。また、キーワード抽出部63は、対象判定部61の判定結果やテキスト読み取り部62の読み取り結果等に基づいて文書を分類し、分類ごとにキーワードを抽出したり、分類ごとに異なる条件(抽出条件)や手法を用いてキーワードを抽出したりしてもよい。さらに、キーワード抽出部63は、抽出したキーワードと、キーワードの抽出に伴って得られる各種の関連情報(各キーワードの出現頻度、抽出を行った日時、抽出対象となった文書の分類等)とを記憶部105やRAM104等の記憶手段に格納する。なお、キーワードの抽出方法は、既存の種々の手法を用いてよい。
表示制御部64は、キーワード抽出部63により抽出されたキーワードの情報(例えば、キーワードのリストや各キーワードの関連情報)を記憶部105等の記憶手段から読み出し、表示部107の表示画面に表示させる。表示制御部64によるキーワードの情報の表示制御は、例えば、操作部106および表示部107を用いたメニュー操作による表示指示を受け付けて行われる。
通信制御部65は、通信部110を制御してキーワード管理サーバ200にアクセスし、記憶部105等の記憶手段に格納されたキーワードの情報を送信する。また、複数の文書処理装置100によりキーワードの抽出および集計を行う場合、通信制御部65は、通信部110を制御して他の文書処理装置100にアクセスし、各々が抽出したキーワードの情報を交換する。これにより、各文書処理装置100の記憶手段には、複数の文書処理装置100により抽出されたキーワードの情報が共有される。
キーワード情報管理部66は、キーワード抽出部63により抽出され、記憶部105等の記憶手段に格納されたキーワードの情報を管理する。複数の文書処理装置100によりキーワードの抽出および集計を行う場合、自装置において抽出したキーワードの情報と、通信制御部65により他の文書処理装置100から取得されたキーワードの情報とを集計して管理する。
<対象判定部61によるキーワード抽出の対象の判定手法>
本実施形態では、文書処理装置100により処理(文書処理)される文書に対して、文書の内容や文書処理装置100が文書に対して行う文書処理の種類等の種々の事象に基づいて設定された判定条件に応じて、文書をキーワード抽出の対象とするか否かを判定する。以下に、例を挙げて説明する。
・文書の内容に基づく判定
本実施形態では、対象判定部61によるキーワード抽出の対象とするか否かの判定を、文書の内容に基づいて行ってもよい。この場合、例えば、文書に対してテキスト読み取り部62による処理を行って、テキストデータを生成する。そして、対象判定部61は、生成されたテキストデータに特定の単語や文字列(以下、特定文字)が存在するか否かを調べる。特定文字としては、例えば、「Confidential」「機密情報」等の文字、会社名等の特定のロゴ等が挙げられる。これらの文字は、通常、その文書が特定の性質を有すること(特定の位置づけであること)を示す。具体的には、機密性を有する文書であることや公的な文書であることなどである。そこで、これらの特定文字が存在する文書を、検出された特定文字の種類に応じて、キーワード抽出の対象としたり、キーワード抽出の対象から除外したりする。例えば、「Confidential」や「機密情報」の文字が記されている文書は、特別な文書であるために、他の文書と比較してキーワードとして抽出される条件(出現回数が多い等)に該当する単語の傾向が異なると考えられる。また、この文書は、扱うことのできる人物が限られているため、キーワードとして抽出される単語は、オフィスや社内でも特定の人物の間でのやり取りでのみ頻出する単語である可能性がある。そこで、キーワードを抽出する目的に応じて、このような特定文字が記された文書のみを対象としてキーワードの抽出を行ってもよいし、特定文字が記された文書をキーワード抽出の対象から除外してもよい。さらに、特定文字を分類し、分類された特定文字の種類ごとにキーワードの抽出結果を分類して管理するようにしてもよい。
また、特定文字は、文書内での使われ方によって意味が異なる場合がある。そこで、特定文字が予め定められた特定の態様で用いられている場合と、他の態様で用いられている場合とで、キーワード抽出を行うか否かについて異なる判定を行ってもよい。
図4は、文書における特定文字の態様を説明する図である。図4(A)は、文書の位置づけを示す特定文字の態様の例を示す図、図4(B)は、文書の内容において特定文字に相当する単語が用いられている例を示す図である。図4(A)に示すように、文書の位置づけを示す特定の態様で特定文字(図示の例では「Confidential」)が記されている場合、その文書が特定文字で示されるように扱われるべき特別な文書であることを意味する。したがって、上述したように、特定文字が記されていることを条件として、キーワード抽出の対象としたり、キーワード抽出の対象から外したり、他の書類と区別してキーワード抽出を行ったりしてよい。一方、図4(B)に示すように、特定文字に相当する単語(図示の例では「Confidential」)が文書中に存在する場合であっても、文書の内容においてその単語が用いられている場合、その記述は、単に文書を記述する上で用いられているだけであり、文書自体の位置づけを表すものではない。したがって、この場合は、この文書に対し、特定文字が記されていることを条件とする特別な扱いは行わず、他の文書と同様に扱う。
特定文字として扱われる態様としては、文字自体の態様や用紙の書式に基づく態様を設定してよい。例えば、予め定められたフォント、サイズ、色などを用いて記載された文字列や、用紙の特定の場所に記載された文字列などが挙げられる。また、印字出力により印字された文字だけでなく、押印等によって形成された文字列を特定文字としてもよい。
図5は、特定文字に基づいてキーワード抽出の対象の判定を行う場合の対象判定部61およびテキスト読み取り部62の動作を示すフローチャートである。図5に示すように、まずテキスト読み取り部62が、例えば画像読み取り部108により読み取った文書画像に対して文字認識処理を行い、テキストデータを生成する(S501)。対象判定部61は、テキスト読み取り部62により生成されたテキストデータを解析し、特定文字が含まれているか否かを判定する。特定文字が含まれている場合(S502でYes)、対象判定部61は、次に検出した特定文字が特定の態様で記載されているか否かを判定する。
特定文字が特定の態様で記載されている場合(S503でYes)、対象判定部61は、対象の文書を特定文字が記されている文書としてキーワード抽出の対象とするか否かの判定を行う(S504)。これに対し、文書に特定文字が含まれていない場合(S502でNo)および特定文字が含まれていても特定の態様で記載されていない場合(S503でNo)は、対象の文書を特定文字が記されている文書ではない通常の文書としてキーワード抽出の対象とするか否かの判定を行う(S505)。
上記の動作例では、対象の文書に関し、まずテキスト読み取り部62によりテキストデータを生成し、このテキストデータに対して特定文字が含まれているか否かを調べた。これに対し、特定の態様で記載された特定文字は、文字の形状や記載される場所等が特定されるため、文字認識を行う前に、特定の態様に対するパターン認識を行うことによって、特定文字の有無を直接判断するようにしてもよい。
・文書の記録形態に基づく判定
本実施形態では、対象判定部61によるキーワード抽出の対象とするか否かの判定を、文書の記録形態に基づいて行ってもよい。例えば、特定の文書に関して、特定の書式で記載したり、文章や図を特定の配置(レイアウト)で記載したりすることが決められている場合、文書の内容を見ることなく、書式や配置のみに基づいて、どのような位置づけの文書かを特定し得る場合がある。このような場合は、テキスト読み取り部62による文字認識を待たずに、画像読み取り部108により読み取った文書画像から書式や配置を識別して文書の種類を特定し、特定した文書の種類に応じてキーワード抽出の対象とするか否かの判定を行ってもよい。また、特定した文書の種類ごとにキーワードの抽出結果を分類して管理するようにしてもよい。
さらに、対象判定部61によるキーワード抽出の対象とするか否かの判定を、文書が記録された用紙の色に基づいて行うことも考えられる。すなわち、特定の文書は特定の色の用紙で作成することが決められていれば、用紙の色を識別することにより文書の種類を特定し得る。そこで、画像読み取り部108により読み取った文書画像が記録されている用紙の色に基づいて文書の種類を特定し、特定した文書の種類に応じてキーワード抽出の対象とするか否かの判定を行ってもよい。また、特定した文書の種類ごとにキーワードの抽出結果を分類して管理するようにしてもよい。
・文書画像に対する文書処理の種類に基づく判定
本実施形態では、文書画像に対して実行される文書処理の種類に応じて、対象判定部61が、キーワード抽出の対象とするか否かに関して異なる判定を行ってもよい。例えば、ファクシミリ受信された文書は、外部から受け付けた文書であるため、オフィスや社内で関心が持たれている事柄とは無関係である可能性が高い。そこで、例えば、複合機の機能のうちファクシミリ機能による処理が行われた文書のうち、ファクシミリ送信の対象となった文書はキーワード抽出の対象とする一方、ファクシミリ受信された文書はキーワード抽出の対象から除外する。同様にして、複写機能であれば複写した部数に応じて異なる判定結果とする等、文書画像に対する文書処理の種類に応じて個別の条件を設け、かかる条件に基づいてキーワード抽出の対象とするか否かを判定するようにしてもよい。また、文書画像に対する文書処理の種類ごとにキーワードの抽出結果を分類して管理するようにしてもよい。
・文書処理の種類に基づくキーワードの重み付け
ここで、文書処理の種類に基づくキーワードの重み付けについて説明する。オフィス等で複合機等の文書処理装置100が使用される場合、用途に応じて使用される文書処理の種類が偏ることが多いと考えられる。例えば、インターネット等の外部ネットワーク上のサイトから一般情報を収集する場合や、データベースを検索する場合、HTML(HyperText Markup Language)文書の閲覧が行われることが多い。また、お客様や取引先との間での情報のやり取りは、ファクシミリや電子メールによる文書の送受信で行われることが多い。また、職務や業務に関する提案や課題を記載した定型文書の作成や編集は、ワードプロセッサやプレゼンテーションソフト等の文書編集用のアプリケーションソフトで行われることが多い。また、業務等で用いられるデータの集計や集計データの編集は、表計算ソフトで行われることが多い。また、メモのような簡易文書の作成や編集、プログラムコードの作成や編集等は、テキストエディタソフトで行われることが多い。また、インターネット等の外部ネットワーク上のサイトから取得した文書やレポートを参照する場合、PDF(Portable Document Format)文書の閲覧が行われることが多い。なお、これらの用途と文書処理との関係は一例にすぎず、文書処理装置100が使用される環境に応じて、個別に様々な特徴が見いだされると考えられる。
そこで、キーワード抽出部63が、キーワードの抽出目的に応じて、上記のような用途と文書処理との関係に基づき、キーワードが抽出された文書処理の種類に応じた重み付けを、抽出されたキーワードに対して行ってもよい。例えば、オフィス内で意識された課題や提案を知るためにキーワード抽出を行う場合を考える。この場合、定型文書の作成等に用いられることの多い文書編集用のアプリケーションソフトで作成された文書に対して文書処理装置100を用いた処理が行われた際に抽出されたキーワードを重要度が高いキーワードとする重み付けを行う。そして、定型文書の作成等に用いられる可能性の少ないPDF文書に対して文書処理装置100を用いた処理が行われた際に抽出されたキーワードを重要度が低いキーワードとする重み付けを行う。また、定型文書の作成等に用いられる可能性がないHTML文書に対して文書処理装置100を用いた処理が行われた場合は、その文書をキーワード抽出の対象から除外する。
また例えば、取引先やお客様とのやり取りの中からキーワード抽出を行う場合を考える。この場合、取引先やお客様とのやり取りで用いられることの多い電子メールやファクシミリによる送受信が行われた際に抽出されたキーワードを重要度が高いキーワードとする重み付けを行う。そして、取引先やお客様に提示する資料として用いられる可能性のある文書編集用のアプリケーションソフトで作成された文書に対して文書処理装置100を用いた処理が行われた際に抽出されたキーワードを中程度の重要度のキーワードとする重み付けを行う。また、取引先やお客様とのやり取りで用いられることがないPDF文書やHTML文書に対して文書処理装置100を用いた処理が行われた場合は、その文書をキーワード抽出の対象から除外する。
また例えば、従業員の一般的な関心事を知るためにキーワード抽出を行う場合を考える。この場合、従業員の一般的な関心事は、例えばインターネット上のサイト等から取得されると考えられる。そこで、HTML文書やPDF文書に対して文書処理装置100を用いた処理が行われた際に抽出されたキーワードを重要度が高いキーワードとする重み付けを行う。
このように、キーワードの抽出目的に応じて、抽出されたキーワードに対し、キーワードが抽出された文書処理の種類に応じた重み付けを行うことにより、抽出目的に対応したキーワードの抽出精度を上げることができる。なお、上述した用途と文書処理との関係に基づく重み付けは例示に過ぎず、実際には、文書処理装置100が使用される環境や設定されるキーワードの抽出目的等に応じて、具体的に重みの値を設定してよい。
・操作者に基づく判定
本実施形態では、文書画像に対する文書処理を実行した操作者に応じて対象判定部61が、キーワード抽出の対象とするか否かに関して異なる判定を行ってもよい。文書処理装置100において操作者の認証を行うことにより、文書画像に対する文書処理を実行した操作者が特定される。そこで、同じ操作であっても、操作を実行した操作者に応じてキーワード抽出の対象とするか否かを判定するようにしてもよい。また、操作を実行した操作者ごとにキーワードの抽出結果を分類して管理するようにしてもよい。このようにすれば、部署や役職等に応じて異なるキーワードが抽出されることを期待し得る。
・操作者に基づくキーワードの重み付け
ここで、操作者に基づくキーワードの重み付けについて説明する。キーワードを抽出する際には、現場の意見の取得、経営に関するキーワードの取得等のように、種々の抽出目的が設定される。そこで、対象判定部61が操作者に応じて実行された操作をキーワードの抽出対象とするか否かを判定することについて上述したが、キーワード抽出部63が、操作者に応じて抽出されるキーワードに重み付けを行ってもよい。例えば、キーワードの抽出目的が現場の意見の取得である場合、現場作業者や外部委託者等が行った操作から抽出されたキーワードを重要度が高いキーワードとする重み付けを行ってもよい。また、キーワードの抽出目的が経営に関するキーワードの取得である場合、管理職の従業員等が行った操作から抽出されたキーワードを重要度が高いキーワードとする重み付けを行ってもよい。これらの操作者以外の操作者(他の操作者)が行った操作をキーワード抽出の対象から除外するのではなく、重み付けにより重要度が低いキーワードとして抽出を行うことにより、キーワードの抽出目的に該当する他の操作者の関心事の情報についても収集することとなる。
・文書の取得に用いられるインターフェイスの種類に基づくキーワードの重み付け
文書処理装置100として複合機を用いる場合、キーワードの抽出対象である文書画像の取得経路としては、オフィス内のLAN等のネットワークを介して取得する経路、記憶装置からの読み出して取得する経路、ファクシミリにより受信して取得する経路など、複数あり得る。そして、文書や業務の種類に応じて使用される取得経路に偏りがあると考えられる。そこで、キーワード抽出部63が、キーワードの抽出目的および文書画像の取得経路に応じて、抽出されたキーワードに対する重み付けを行ってもよい。文書画像の取得経路は、例えば、文書画像を取得するために用いられるインターフェイスによって特定される。
一例として、文書処理装置100としての複合機が、文書画像を取得するためのインターフェイスとして、有線による通信のための2種類の接続手段(第1、第2有線接続手段)と、無線通信手段と、ファクシミリによる送受信を行うための接続手段(FAX接続手段)とを有するものとする。また、文書画像を取得するためのインターフェイスの一種として文書画像の保持手段を考え、文書処理装置100としての複合機が、文書画像の保持手段として、内部メモリと、着脱可能な記憶媒体を備えた外部メモリとを有するものとする。そして、オフィスの従業員が複合機を用いて文書を出力したり読み込ませたりする際に用いる通信手段として第1有線接続手段に接続されたネットワークを用い、データベースの記録内容を定期的に印刷出力するような定型処理に用いる通信手段として第2有線接続手段に接続されたネットワークを用いるものとする。また、無線通信手段およびFAX接続手段は、オフィスの従業員以外(外部)の者(一般来訪者など)が複合機を用いて文書を出力したり読み込ませたりする際に用いる通信手段とする。また、内部メモリや外部メモリは、他の事業所の従業員が複合機を用いて文書を出力したり読み込ませたりする際に、文書画像の保持手段として用いられるものとする。
以上のように運用されている場合に、キーワードの抽出目的として、オフィス内での関心事に関するキーワードを取得しようとする場合を考える。この場合、例えば、オフィスの従業員が主に用いる手段を経由して取得した文書画像に対する操作から抽出されたキーワードの重要度を高くし、オフィスの従業員以外の者が主に用いる手段を経由して取得した文書画像に対する操作から抽出されたキーワードの重要度を低くするような重み付けが考えられる。一例として、この場合、第1有線接続手段を介して取得された文書画像に対する操作から抽出されたキーワードに対して、重要度が高いキーワードとする重み付けを行う。また、データベースに対する定型処理は、対象の文書に同一の文言が大量に重複して現れるためキーワードの抽出には不向きである。そこで、第2有線接続手段を介して取得された文書画像に対する操作を、キーワードの抽出対象から除外する。また、外部の者が行った操作の対象となった文書画像は、オフィス内の関心事に関するキーワードの取得にはあまり適さないが、オフィス内の複合機を用いて行われた操作であるから全く無関係とも言えない。そこで、無線通信手段を介して取得された文書画像に対する操作から抽出されたキーワードに対して、重要度が低いキーワードとする重み付けを行う。また、他の事業所の従業員が行った操作の対象となった文書画像は、キーワードの抽出対象として、オフィス内の従業員が行った操作の対象となった文書画像ほど有用ではないが、外部の者が行った操作の対象となった文書画像よりも有用と考えられる。そこで、内部メモリや外部メモリから読み出された文書画像に対する操作から抽出されたキーワードに対して、重要度が中程度とするキーワードとする重み付けを行う。
このようにキーワードに対する重み付けを行うことで、オフィス内での関心事に関するキーワードの取得等のような、具体的な抽出目的に応じたキーワードの抽出の精度が向上する。なお、上述した複合機(文書処理装置100)の運用や重み付けは例示に過ぎず、上記の例に限定されるものではない。
<複数の文書処理装置による連携>
図1に示したように、本実施形態では、キーワード管理サーバ200に複数の文書処理装置100が接続され得る。キーワード管理サーバ200により複数の文書処理装置100で抽出されたキーワードを管理する場合、文書処理装置100ごとにキーワードの抽出結果を分類して集計し管理するようにしてもよい。また、役員室や特定の部署に設置された文書処理装置100からはキーワードの抽出を行わないという制御を行ってもよい。複数の文書処理装置100を連携させ、上述したキーワード抽出の対象とするか否かの判定手法と組み合わせることにより、特定の部署で特定の文書処理が行われた文書のみを対象としてキーワードを抽出したり、そのような文書のみをキーワード抽出の対象から除外したりするといった複雑な制御を行ってもよい。
また、キーワード管理サーバ200を設けず、複数の文書処理装置100どうしで抽出したキーワードの情報を交換し、共有するようにしてもよい。この場合、例えば、1日の予め定められた時間に各文書処理装置100がキーワードの情報を送受信することにより、保持する情報の同期を図る。
<文書処理装置の他の例>
図2に示した例では、文書処理装置100を複合機に適用した場合を例として説明したが、文書処理装置100を適用可能な機器は複合機に限定されない。本実施形態では、画像化する手間をかけるような文書からキーワードを抽出することにより、重要でない単語(いわゆるノイズ)を削減し、重要なキーワードを精度よく抽出する。したがって、画像化された文書を扱う種々の処理装置を、文書処理装置100としてよい。例えば、投影機(プロジェクタ)を文書処理装置100としてもよい。
10…キーワード抽出システム、60…制御部、61…対象判定部、62…テキスト読み取り部、63…キーワード抽出部、64…表示制御部、65…通信制御部、66…キーワード情報管理部、67…認証部、100…文書処理装置、101…バス、102…CPU、103…ROM、104…RAM、105…記憶部、106…操作部、107…表示部、108…画像読み取り部、109…画像形成部、110…通信部、111…画像処理部、112…認証処理部、200…キーワード管理サーバ

Claims (10)

  1. 画像を処理する画像処理部と、
    前記画像処理部の処理対象である画像をキーワード抽出の対象とするか否かを判定する対象判定部と、
    前記画像処理部の処理対象である画像からテキストを読み取るテキスト読み取り部と、
    前記対象判定部によりキーワード抽出の対象と判定された画像を対象として前記テキスト読み取り部により読み取られたテキストからキーワードを抽出するキーワード抽出部と、
    を備えることを特徴とする、文書処理装置。
  2. 前記対象判定部は、前記テキスト読み取り部により読み取られたテキストに、予め定められた特定文字が含まれているか否かに応じて、キーワード抽出を行うか否かを判定することを特徴とする、請求項1に記載の文書処理装置。
  3. 前記対象判定部は、前記特定文字が前記画像から読み取られたテキストに含まれている場合であっても、当該特定文字が予め定められた特定の態様で前記画像に記録されている場合は、当該特定の態様以外の態様で記録されている場合とは異なる判定結果とすることを特徴とする、請求項2に記載の文書処理装置。
  4. 前記対象判定部は、前記画像処理部によって行われる処理の種類に応じて特定される判定条件に基づき、前記画像をキーワード抽出の対象とするか否かを判定することを特徴とする、請求項1乃至請求項3のいずれかに記載の文書処理装置。
  5. 前記キーワード抽出部は、前記画像処理部によって行われる処理の種類に応じて特定される抽出条件に基づき、キーワードを抽出することを特徴とする、請求項1乃至請求項4のいずれかに記載の文書処理装置。
  6. 前記キーワード抽出部は、前記画像処理部によって行われる処理の種類に応じて、抽出されたキーワードに対して重み付けを行うことを特徴とする、請求項1乃至請求項5のいずれかに記載の文書処理装置。
  7. 画像処理部に処理を実行させる操作者を認証する認証手段をさらに備え、
    前記キーワード抽出部は、前記認証手段による認証により特定された操作者に応じて、抽出されたキーワードに対して重み付けを行うことを特徴とする、請求項1乃至請求項5のいずれかに記載の文書処理装置。
  8. 処理対象の画像を取得するために用いられるインターフェイスを複数備え、
    前記キーワード抽出部は、複数の前記インターフェイスのうち、キーワードの抽出対象となった画像の取得に用いられたインターフェイスの種類に応じて、抽出されたキーワードに対して重み付けを行うことを特徴とする、請求項1乃至請求項5のいずれかに記載の文書処理装置。
  9. 前記キーワード抽出部により抽出されたキーワードの情報を管理する管理部と、
    他の文書処理装置とデータ交換を行うための通信部と、をさらに備え、
    前記管理部は、前記通信部を介して、他の文書処理装置により抽出されたキーワードの情報を取得し、自装置のキーワード抽出部により抽出されたキーワードの情報と共に管理することを特徴とする、請求項1乃至請求項8のいずれかに記載の文書処理装置。
  10. コンピュータを制御し、
    画像を処理する画像処理手段と、
    前記画像処理手段の処理対象である画像をキーワード抽出の対象とするか否かを判定する対象判定手段と、
    前記画像処理手段の処理対象である画像からテキストを読み取るテキスト読み取り手段と、
    前記対象判定手段によりキーワード抽出の対象と判定された画像を対象として前記テキスト読み取り手段により読み取られたテキストからキーワードを抽出するキーワード抽出手段として、
    前記コンピュータを機能させることを特徴とする、プログラム。
JP2017047551A 2017-03-13 2017-03-13 文書処理装置およびプログラム Pending JP2018151854A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017047551A JP2018151854A (ja) 2017-03-13 2017-03-13 文書処理装置およびプログラム
US15/783,099 US10477043B2 (en) 2017-03-13 2017-10-13 Document processing apparatus and non-transitory computer readable medium for keyword extraction decision

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017047551A JP2018151854A (ja) 2017-03-13 2017-03-13 文書処理装置およびプログラム

Publications (1)

Publication Number Publication Date
JP2018151854A true JP2018151854A (ja) 2018-09-27

Family

ID=63445692

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017047551A Pending JP2018151854A (ja) 2017-03-13 2017-03-13 文書処理装置およびプログラム

Country Status (2)

Country Link
US (1) US10477043B2 (ja)
JP (1) JP2018151854A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111797262A (zh) * 2020-06-24 2020-10-20 北京小米松果电子有限公司 诗词生成方法、装置、电子设备和存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019079551A1 (en) * 2017-10-20 2019-04-25 Heretik Inc. METHOD AND SYSTEM FOR DYNAMIC CONFIGURATION OF A USER INTERFACE FOR A SPECIFIED DOCUMENT EXAMINATION TASK
CN110838003B (zh) * 2019-10-31 2023-08-15 珠海市蜜蜂科技有限公司 共享办公的管理系统、方法、设备及可读介质

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4320491B2 (ja) * 1999-11-18 2009-08-26 ソニー株式会社 文書処理システム、端末装置、文書提供装置、文書処理方法、記録媒体
JP4843867B2 (ja) * 2001-05-10 2011-12-21 ソニー株式会社 文書処理装置、文書処理方法および文書処理プログラム、ならびに、記録媒体
JP4538284B2 (ja) * 2004-09-09 2010-09-08 株式会社リコー 情報検索システム、情報検索端末、並びに、プログラムおよび記録媒体
US20080243818A1 (en) 2007-03-30 2008-10-02 Konica Minolta Systems Laboratory, Inc. Content-based accounting method implemented in image reproduction devices
JP2008288799A (ja) 2007-05-16 2008-11-27 Nec Access Technica Ltd 画像データ送信装置、画像データ送信方法、及び画像データ送信プログラム
JP5031472B2 (ja) * 2007-07-23 2012-09-19 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
US8438630B1 (en) * 2009-03-30 2013-05-07 Symantec Corporation Data loss prevention system employing encryption detection
US9002838B2 (en) * 2009-12-17 2015-04-07 Wausau Financial Systems, Inc. Distributed capture system for use with a legacy enterprise content management system
JP5664007B2 (ja) * 2010-08-09 2015-02-04 株式会社リコー データ中継装置,画像形成装置,画像形成システム,印刷制御方法,印刷制御プログラム,および記録媒体
CN102602158B (zh) * 2011-01-21 2015-05-27 株式会社东芝 印刷介质再生装置以及印刷介质再生方法
US20120240243A1 (en) * 2011-03-16 2012-09-20 Yasden - Comercio International E Servicos, Sociedade Unipessoal LDA System, method, and computer program product for creation, transmission, and tracking of electronic document
JP2014182741A (ja) 2013-03-21 2014-09-29 Nec Corp 提案書作成支援装置、方法、及び、プログラム
EP3201813B1 (en) * 2014-09-30 2019-12-18 Hewlett-Packard Development Company, L.P. Cancellation requests
US20170262545A1 (en) * 2016-03-09 2017-09-14 Le Holdings (Beijing) Co., Ltd. Method and electronic device for crawling webpage

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111797262A (zh) * 2020-06-24 2020-10-20 北京小米松果电子有限公司 诗词生成方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
US10477043B2 (en) 2019-11-12
US20180262635A1 (en) 2018-09-13

Similar Documents

Publication Publication Date Title
CN109934244B (zh) 格式类别学习系统以及图像处理装置
JP5712487B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
US9967416B2 (en) Document policies for a document processing unit
JP4159583B2 (ja) 複合機、及び該複合機を複数備えた情報取得システム
KR101814120B1 (ko) 이미지를 전자문서에 삽입하는 방법 및 이를 수행하는 장치
US8310711B2 (en) Output device and its control method for managing and reusing a job history
JP6503926B2 (ja) プログラム及び情報処理装置
US20140362235A1 (en) Information processing system and information processing method
JP2009295153A (ja) ウェブベースのテキスト検出方法及びシステム
JP2009224958A (ja) 業務手順推定システム及びプログラム
US20100321709A1 (en) Automated audit system, apparatus and method
US8266526B2 (en) Distributed and decentralized document management system and method
JP4695388B2 (ja) セキュリティ情報推定装置、セキュリティ情報推定方法、セキュリティ情報推定プログラム及び記録媒体
US10477043B2 (en) Document processing apparatus and non-transitory computer readable medium for keyword extraction decision
JP4895696B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
US20100145988A1 (en) Image processing apparatus, method for managing image data, and computer-readable storage medium for computer program
JP6879034B2 (ja) プログラム、情報処理装置、及びシステム
JP2010279040A (ja) 定様式の装置レポートを生成するシステムおよび方法
US9286531B2 (en) Log-image extracting apparatus for high security
JP6281739B2 (ja) 処理装置及びプログラム
JP7388411B2 (ja) 情報処理システム、通信システム、情報処理方法
US20220269855A1 (en) Information generation system, workflow system, computer-readable non-transitory recording medium storing information generation program, and computer-readable non-transitory recording medium storing workflow program
JP2007011910A (ja) アンケート装置及びプログラム
KR20230022698A (ko) 복수의 수신처의 보안 등급에 따른 보안 문서를 전송
JP6919179B2 (ja) システム、サーバ装置およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201217

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210224