JP2005044356A - 文書処理装置、文書処理方法、文書処理装置の制御プログラムおよびコンピュータ読み取り可能な記録媒体 - Google Patents

文書処理装置、文書処理方法、文書処理装置の制御プログラムおよびコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP2005044356A
JP2005044356A JP2004208465A JP2004208465A JP2005044356A JP 2005044356 A JP2005044356 A JP 2005044356A JP 2004208465 A JP2004208465 A JP 2004208465A JP 2004208465 A JP2004208465 A JP 2004208465A JP 2005044356 A JP2005044356 A JP 2005044356A
Authority
JP
Japan
Prior art keywords
document
data
program
text data
vocabulary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004208465A
Other languages
English (en)
Inventor
Guy Eden
エデン ガイ
Lena Sojian
ソジャン レナ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2005044356A publication Critical patent/JP2005044356A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/23Reproducing arrangements
    • H04N1/2307Circuits or arrangements for the control thereof, e.g. using a programmed control device, according to a measured quantity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1202Dedicated interfaces to print systems specifically adapted to achieve a particular effect
    • G06F3/1203Improving or facilitating administration, e.g. print management
    • G06F3/1207Improving or facilitating administration, e.g. print management resulting in the user being informed about print result after a job submission
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/1259Print job monitoring, e.g. job status
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1278Dedicated interfaces to print systems specifically adapted to adopt a particular infrastructure
    • G06F3/1285Remote printer device, e.g. being remote from client or server
    • G06F3/1286Remote printer device, e.g. being remote from client or server via local network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1278Dedicated interfaces to print systems specifically adapted to adopt a particular infrastructure
    • G06F3/1285Remote printer device, e.g. being remote from client or server
    • G06F3/1288Remote printer device, e.g. being remote from client or server in client-server-printer device configuration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00355Mark-sheet input
    • H04N1/00358Type of the scanned marks
    • H04N1/0036Alphanumeric symbols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00355Mark-sheet input
    • H04N1/00368Location of the scanned marks
    • H04N1/00374Location of the scanned marks on the same page as at least a part of the image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/23Reproducing arrangements
    • H04N1/2307Circuits or arrangements for the control thereof, e.g. using a programmed control device, according to a measured quantity
    • H04N1/2338Circuits or arrangements for the control thereof, e.g. using a programmed control device, according to a measured quantity according to user specified instructions, e.g. user selection of reproduction mode

Abstract

【課題】 文書の処理を文書に記載された内容に応じて制御できる文書処理装置、文書処理方法、文書処理装置の制御方法、文書処理装置の制御プログラムおよびコンピュータ読み取り可能な記録媒体を提供する。
【解決手段】 メモリ112は、テキストデータに含まれる語彙と該テキストデータを処理する出力プログラムとの対応関係を記憶する。評価部108は、テキストデータから語彙を抽出し、メモリ112に格納された対応関係に基づいて、当該テキストデータを処理する出力プログラムを選択する。プログラム実行部140は、評価部108が選択した出力プログラムによりテキストデータを処理する。
【選択図】 図1


Description

本発明は、一般的に、デジタル文書処理(digital document processing)に関するものである。本発明は、より具体的には、文書(書類、ドキュメント)の内容の分類に応じて、文書に関連付けられている処理操作を行うための文書処理装置、文書処理方法、文書処理装置の制御プログラムおよびコンピュータ読み取り可能記録媒体に関するものである。
例えば大企業の文書を管理する場合、様々な理由により、例えば、部門、件名、個人的なユーザ名、題目、内容および収益などに基づいて、文書の流れを追跡する。そのため、文書の発信元または送信先に基づいて管理プロセスを組織化することが論理的である。
しかし、文書を発信元または最終的な送信先から追跡することが、システム管理者にとって常に便利なわけではない。また、文書を管理するための他の論理的な方法として、これらの文書を複写するために従来使用されているプリンタ、コピー機またはスキャナーを利用する方法がある。しかし、これらは、十分に利用されていない。
従来、紙の文書または電子文書は、文書をプリンタまたはコピー機へ提供することに付随した1セットのコマンド(命令)に応じて処理される。例えば、文書を、プリンタへ供給し、ユーザは、コピーする枚数、または、電子コピーの宛先を選択する。
米国特許6,209,992(2001年4月3日発行) 米国特許6,202,092(2001年3月13日発行) 米国特許6,163,383(2000年12月19日発行) 特開2000−253241(2000年9月14日公開)
これまでに、プリント中の文書(書類、ドキュメント)に関連付けられている電子水準またはパスワードに基づいてプリントジョブをフィルタすることは知られている。しかし、プリント装置に、文書の内容に基づいた動作を選択させる設備は無い。
そこで、文書の処理を文書の内容に応じて制御できれば有利である。ここで、文書の内容(文書のプリントコンテンツ)とは、文書に記載されている内容のことである。
また、ユーザが指示する従来の処理と並行して、文書内容に応じた文書管理操作を実行できれば有利である。
また、ユーザが直接的に関与しなくても、従来の文書処理と並行して、上記管理操作を実行できれば有利である。
本願発明は上記問題を鑑みなされたものであり、その目的は、文書に対する処理を文書に記載された内容に応じて制御できる文書処理装置、文書処理方法、文書処理装置の制御プログラムおよび記録媒体を提供することである。
本発明の文書処理装置は、上記課題を解決するために、テキストデータに含まれる語彙と該テキストデータを処理する出力プログラムとの対応関係を記憶する記憶部と、テキストデータから語彙を抽出し、上記記憶部に格納された上記対応関係に基づいて、当該テキストデータを処理する出力プログラムを選択する評価手段と、上記テキストデータを上記評価手段によって選択された出力プログラムにより処理するプログラム実行手段を有することを特徴としている。
また、本発明の文書処理方法は、上記課題を解決するために、テキストデータに含まれる語彙と該テキストデータを処理する出力プログラムとの対応関係を記憶する記憶部を備えた装置における文書処理方法であって、テキストデータから語彙を抽出し、上記記憶部に格納された上記対応関係に基づいて、当該テキストデータを処理する出力プログラムを選択する評価ステップと、上記テキストデータを上記評価ステップによって選択された出力プログラムにより処理するプログラム実行ステップとを有することを特徴としている。
上記構成および方法によると、テキストデータに所定の語彙が含まれていると、その語彙に対応付けられた出力プログラムによる処理をテキストデータに対して実行することができる。つまり、テキストデータに対する処理をテキストデータに記載された内容に応じて制御をすることができる。
ここで、出力プログラムとは、文書(書類、ドキュメント)のレポートの送信、文書プリント処理の停止、文書プリント処理の記録、データベースの更新、文書の保存(記録、アーカイブ)、文書に対する付加処理を開始するためのプログラムの実行、および文書に対する付加処理を開始するための複数のプログラムの実行、のうちの少なくとも何れか1つを含むプログラムであってもよい。
本発明の文書処理装置は、上記構成に加え、ページ記述言語データから上記テキストデータを生成し上記評価手段に供給する翻訳手段を有してもよい。
上記構成によると、ページ記述言語データで記述されたデータを処理することができる。そのため、文書処理装置を、例えば、多機能周辺装置(MFP、Multifunctional peripheral)、レーザープリンタ、インクジェットプリンタまたはファックス機などのプリント装置で行う文書のプリントまたはスキャンに利用することができる。
本発明の文書処理装置は、上記構成に加え、上記語彙が、予め設定された文字列であってもよい。
上記構成によると、予め設定された文字列がテキストデータに含まれていると、それに対応した出力プログラムが実行される。なお、予め定められた文字は、例えば、キーワード、符号、ワードパターン、およびデータパターンのいずれか、あるいは、複数の種類を含んでいてもよい。なお、これらは単なる例示であり、語彙はこれらに限定されることはない。
本発明の文書処理装置は、上記構成に加え、取得した文書データをページ記述言語データに生成し、上記翻訳手段に供給するページ記述言語データ生成手段を備えていてもよい。
上記構成によると、どのような文書データを取得してもそのデータに対して、含まれている語彙を基に、出力プログラムを選択して実行することができる。
本発明の文書処理装置は、上記構成に加え、上記ページ記述言語データ生成手段は、取得した文書データをプリンタ制御言語とポストスクリプトとの何れかのページ記述言語データに生成してもよい。なお、ポストスクリプト(PostScript)はアドビ システムズ インコーポレイテッド社の登録商標である。
上記構成によると、広く普及しているプリンタ制御言語あるいはポストスクリプトのページ記述言語を利用することができる。
本発明の文書処理装置は、上記構成に加え、ビットマップ文書に対して光学的特性認識操作を実行しテキスト列からなる文書データを生成するテキスト列生成手段を備え、上記ページ言語データ生成手段は、上記テキスト列生成手段からテキスト列よりなる文書データを取得してもよい。
上記構成によると、ビットマップ文書に対しても含まれている語彙を基に、出力プログラムを選択して実行することができる。
本発明の文書処理装置は、上記構成に加え、上記プログラム実行手段が上記翻訳手段により上記ページ記述言語データから生成されたテキストデータを処理する際に、上記ページ記述言語データに対し、スキャン、ファックス、保存、伝送および紙への複写、のうちの少なくとも1つの処理を行うプリント処理手段を備えていてもよい。
上記構成によると、ページ記述言語データに対してユーザが指示する従来の処理と並行して、プログラム実行手段が行う処理を実行することができる。
なお、上記文書処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各手段として動作させることにより上記文書処理装置をコンピュータにて実現させる文書処理装置の制御プログラム、及びその文書処理装置の制御プログラムを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
これらの構成によれば、上記文書処理装置の制御プログラムを、コンピュータに読み取り実行させることによって、上記文書処理装置と同一の作用効果を実現することができる。
また、本発明は、多機能周辺装置(MFP、Multifunctional peripheral)、レーザープリンタ、インクジェットプリント装置またはファックス機などのプリント装置で行う文書のプリントまたはスキャンに応じて、プリントコンテンツに基づいた文書管理動作を行うシステムおよび方法に関するものである。文書のテキスト部分の「プリント評価」を利用することによって、設計された文書プリンタは、ユーザが規定した規則および指標に基づいて、選択したプリントジョブまたはスキャンに対して動作を起こす。
本発明は、従来のプリンタ/スキャナーには無かった制御水準を提供する。従来のプリント装置は、プリントコンテンツに基づいて分類する、または、動作を起こすための手段を提供しない。ユーザが規定した1セットの分類をプリントコンテンツに基づいて提供することにより、文書を自動的に分類し、プリントコンテンツに基づいてプログラムを実行するための新しい分野の可能性が広がる。
例えば、システム管理者は、プリンタが受信した全てのテキスト文書に対して「探知機」としての機能を果たす語彙を定義してもよい。語彙が検出された時に起こる動作は、ユーザが規定したものでもよいし、経理などの業務を含んでいてもよい。例えば、任意の月に「発表」という語を含む文書が何件プリントされたか、または、販売部のロゴのついた文書が何件プリントされたかが記録されてもよい。
従って、文書のプリントコンテンツに応じたプリンタ装置制御方法が提供される。この方法は、語彙項目のライブラリを構築するステップと、実行可能プログラムのライブラリを構築するステップと、プリンタ処理のために文書を受け付けるステップと、文書にあるプリントコンテンツをライブラリにある語彙項目と照合することにより、文書にあるプリントコンテンツを評価するステップと、語彙項目のライブラリと実行可能プログラムのライブラリとの対応付けを行うステップと、プログラムまたは複数のプログラムを、プリントコンテンツ評価に応じて実行するステップとを含んでいる。
この方法は、例えば、語彙項目のライブラリを構築するステップが、キーワード、符号、ワードパターンまたはデータパターンなどの項目を使用するステップを含んでいてもよい。実行可能プログラムのライブラリを構築するステップは、実行可能プログラムを構築するステップを含んでいてもよい。実行可能プログラムの考えられる例をいくつか挙げると、受信者への文書のレポートの送信、文書プリントプロセスの阻止(blocking)、文書プリントプロセスの記録(logging)、データベースの更新(updating)、文書の所定期間保存(archiving)または付加文書プロセッシングを開始するためのプログラムの実行などであってもよい。
他の例では、プリンタプロセッシングのために文書を受け付けるステップが、一般的にはページ記述言語ファイル(例えば、プリンタ制御言語(PCL)またはポストスクリプト)に、プリンタドライバ出力ファイルを生成するステップと、プリンタドライバ出力ファイルを、ラスタ化イメージへ翻訳するステップとを含んでいる。次に、文書にあるプリントコンテンツをライブラリにある語彙項目と照合するステップは、ラスタ化イメージを言語構成要素(tokens)へ構文解析するステップと、プリントされるデータを表す言語構成要素を識別するステップと、プリントされるデータを一時保存するステップと、語彙項目のために一時保存したデータを試験するステップとを含んでいてもよい。
本発明の文書処理装置は、上記のように、テキストデータに含まれる語彙と該テキストデータを処理する出力プログラムとの対応関係を記憶する記憶部と、テキストデータから語彙を抽出し、上記記憶部に格納された上記対応関係に基づいて、当該テキストデータを処理する出力プログラムを選択する評価手段と、上記テキストデータを上記評価手段によって選択された出力プログラムにより処理するプログラム実行手段を有する。
上記構成によると、テキストデータに所定の語彙が含まれていると、その語彙に対応付けられた出力プログラムによる処理をテキストデーアに対して実行することができる。つまり、テキストデータに対する処理をテキストデータに記載された内容に応じて制御をすることができる。
本発明の一実施形態について図1〜図4に基づいて説明すると以下の通りである。しかし、本発明はこれに限定されるものではない。
図1は、本実施形態の文書処理装置100の概略的なブロック図である。なお、本実施形態では、文書処理装置100は、プリンタに実装されているものとする。なお「プリンタ」とは、文書(書類、ドキュメント)を単に出力するプリンタ以外にも、例えば、コピー機、スキャナー、MFPおよびファックス機などの装置を含む。
文書処理装置100は、翻訳部(インタープリタ、翻訳手段)102、評価部(評価手段)108、メモリ(記憶部)112、実行部(出力プログラム実行手段)140を備えている。翻訳部102は、ライン104に、プリントドライバ出力ファイルを受信する入力部を備え、ライン106に、プリンタ処理のために翻訳された文書を供給する出力部を備えている。評価部108は、ライン106に、翻訳された文書を受信するインターフェースを備えている。評価部108は、翻訳された文書にあるプリントコンテンツを評価し、プリントコンテンツの評価に応じて実行するプログラムを選択する。ここで使用されているように、「プリンタ」という用語は、コピー機、スキャナー、MFPおよびファックス機などの装置を含むことを意味している。なお、これらの装置は、一般的に、紙の文書の処理と関連付けられているが、文書処理の一部として、紙の文書の受付け、供給または電子フォーマットへの変換も行う。翻訳部102および評価部108は、電子的フォーマットされた文書を編集する。
語彙項目のライブラリ110は、メモリ(記憶部)112の一部に記憶され、ライン107で評価部108のインターフェースと接続されているインターフェースを備えている。評価部108は、翻訳部102で翻訳された文書にあるプリントコンテンツに含まれる語彙を、語彙項目のライブラリにある語彙項目と照合するために、語彙項目のライブラリ110へアクセスする。
対応付けライブラリ116は、メモリ112に記憶されており、語彙項目と実行可能なファイルとを対応付けている。対応付けライブラリ116は、さらに、評価部108のインターフェースと接続されているライン107に、インターフェースを備えている。評価部108は、語彙項目のライブラリ110の語彙項目とプリントコンテンツに含まれる語彙との照合に応じて、実行可能プログラムのライブラリ114から実行可能プログラム(出力プログラム)を選択するために、対応付けライブラリ116へアクセスする。
実行可能プログラムのライブラリ114は、メモリ112の一部に記憶されており、さらに、評価部108のインターフェースと接続されているライン107に、インターフェースを備えている。なお、実行可能プログラムが文書処理装置100の外部に記憶されていてもよいし、実行可能プログラムをネットワークを介してダウンロードしてもよい。
プログラム実行部140は、評価部108が語彙項目と照合して選択した実行可能プログラム(出力プログラム)を、ライン144を介して実行可能プログラム114のライブラリから読み出し、読み出した実行可能プログラムを実行して文書を処理する。なお、実行可能プログラムについては、後段で説明する。プログラム実行部140は、プリント処理を行うプリントプロセッサー136bを備えており、実行可能プログラムが以下で説明するプリントプロセッサーが行うプリント処理に関するプログラムである場合、プリントプロセッサー136bが文書を処理する。また、プログラム実行部140は、通信部141を備えており、実行可能プログラムの実行を外部処理装置に対して行わせるようにしてもよい。
一般的に、全ての上記装置構成要素インターフェースは、共通アドレス/データバス(例えば、ライン106,104で表わす)と接続されている。
図2は、図1のメモリ112をより詳しく示す図である。語彙項目とは、文書に含まれる(含まれると予想される)単語、熟語等の語彙である。語彙項目のライブラリ110は、例えば、キーワード、符号、ワードパターンまたはデータパターンなどの項目を含んでいてもよい。また、図示された語彙項目は、単なる例示であり、考えられる全ての項目の唯一のリストではない。図2に示すように、語彙項目(キーワード項目)の全てが、2つの実行可能プログラム(動作)に対応付けられている。なお、対応付けは1つでも3つ以上であってもよく、また、図示した対応付けも単なる例示である。また、語彙項目のライブラリ110は、キーワードとデータパターン(図示せず)のように異なるタイプの語彙項目を組み合わせて含んでいてもよく、各語彙項目に対して、同じ対応付けが存在している必要はない。また、対応付けは、予め設定されていてもよいし、ユーザが設定できるようになっていてもよい。
実行可能プログラム(実行可能項目)は、プログラム実行部140が行う処理動作のプログラムである。実行可能プログラムのライブラリ114は、例えば、受信者への文書のレポートの送信、文書プリント処理の阻止、文書プリント処理の記録、データベースの更新、文書の保存、付加文書処理を開始するためのプログラムの実行、または付加文書処理を開始するための複数のプログラムの実行、などのプログラムを含んでいてもよい。複数のプログラムが、並行または連続操作によって生じてもよい。ただし、保存、記録、データベースおよび文書処理の実行可能プログラムは、必ずしも、プリンタ101によって実行される必要はなく、他のプリンタ、および/または、ネットワークを介してプリンタ101と接続されている外部情報処理装置(図示せず)によって実行されてもよい。この付加処理は、文書のコピーをシステム管理者のコピー機でプリントすること、または、文書の管理と関連付けられている実行可能事項を実行すること、等の規定の文書処理でもよい。あるいは、規定のマルチプル実行可能プログラムが実行されてもよい。これら実行可能プログラムは単なる例示であり、また、図示された実行可能プログラムも単なる例示であり、考えられる全ての実行可能プログラムの唯一のリストではない。また、単一の語彙項目が、複数の実行可能プログラムに対応付けられていてもよく、または、複数の語彙項目が、単一の実行可能プログラムに対応付けられてもよい。
図1に示すように、文書処理装置100は、さらに、評価部108のインターフェースと接続されているライン106に、インターフェースを有するバッファ118が備えられていてもよい。この場合、翻訳部102は、プリンタドライバ出力ファイルを、ラスタ化イメージに翻訳し、評価部108が、ラスタ化イメージを、言語構成要素に構文解析する。このとき、プリントされるデータはバッファ118に格納される。そして、評価部108は、プリントされるデータを表す言語構成要素を識別し、語彙項目のライブラリ110との照合に対してバッファ118に保存したデータを試験してもよい。
文書処理装置100は、さらに、プリントドライバ(ページ記述言語生成手段)120を備えていてもよい。このプリントドライバ120は、ライン122に文書を受け付ける入力部を備え、ライン104にプリントドライバ出力ファイルを供給する出力部を備えている。文書処理装置100の1つの例では、プリントドライバ120が、プリンタ101に埋設されていてもよい。このような構造により、プリンタ101は、電子文書(例えば、ネットワークを介して受信する電子メールに添付されている)を受け付けることができ、受信した文書から、プリントドライバ出力ファイルを準備する。以下でさらに詳しく説明するが、他の例では、プリントドライバ120が、紙の文書から得たテキスト列(text strings)を受け付けるように調整されていてもよい。なお、プリンタ101は、紙の文書に対して光学的特徴認識(OCR、Optical Character Recognition)処理を行ってもよい。
あるいは、プリントドライバ126は、例えばパーソナルコンピュータ(PC)128と関連付けられていてもよい。PCに関連づけられたプリントドライバ126は、例えばPCワードプロセッサーアプリケーションからの文書を、ライン129を介して受け付け、プリントドライバ出力ファイルを、ネットワーク124を介して翻訳部102へ配信してもよい。
プリントドライバ120/126を有している場合は常に、プリントドライバ120/126が、ページ記述言語(PDL、Page description Language)で生成された出力ファイルを供給することが一般的である。ページ記述言語は、機械独立型の高レベル言語である。翻訳部102は、例えば特定のフォントを選択するPDL命令に応じて、特定の文字を作り出すか、あるいは、様々なフォントサイズを生成するために、格納したフォントを基準化する。このようなページ記述言語の1つは、HPと関連付けられているプリンタ制御言語(PCL)、または、Adobeと関連付けられているポストスクリプトである。しかし、本発明は、何かの特定のページ記述言語に制限されない。ページ記述言語が何であろうと、翻訳部102は、例えば、ASCIIテキストをプリンタ固有の機械言語に変換するなどの機能を、通常通りに実行する。
図1に示すように、文書処理装置100は、さらに、OCRユニット(テキスト列生成手段)130を備えていてもよい。このOCRユニット130は、ライン132に、ビットマップ文書を受信する入力部を備えている。ビットマップ文書では、ビットのアッセンブリ使用してテキストおよび/またはイメージを直接的に表す。ライン132から受信するビットマップ文書は、例えば、プリンタ101が紙の文書をスキャンした結果でもよい。OCRユニット130は、ライン122に出力部を備え、この出力部は、ビットマップ文書に対して行ったOCR操作の結果生じるテキスト列を供給するためのものである。次に、プリントドライバ120は、OCRユニットにより生成されたテキスト列を、プリント処理のために受け付ける。すなわち、プリントドライバ120は、テキスト列からプリントドライバ出力ファイルを生成する。
文書処理装置100は、さらに、プリントプロセッサー136a.bを備えていてもよい。このプリントプロセッサー136aは、ライン141に、プリントドライバ120からの出力を受け付ける入力部を備え、ライン143に、処理された文書を供給する出力部を備えている。このプリントプロセッサー136bは、ライン106に、翻訳部102からの出力を受け付ける入力部を備え、ライン138に、処理された文書を供給する出力部を備えている。
プリントプロセッサー136a.bは、従来の、または、ユーザの意図するプリンタ101の処理と関連している。しかし、これらの従来処理の1つ以上は、文書のプリントコンテンツの評価に応じて実行される実行可能プログラムの結果でもよい。また、上記評価および実行可能プログラムの処理は、従来の文書処理と並行してバックグラウンドで行ってもよく、ユーザは気づかないことさえありうる。プリントプロセッサー136a.bが実行する処理は、例えば、紙の文書をプリンタ101へ提出することに応じたスキャン処理、紙または電子文書の提出に応じたファックス処理、紙または電子文書の提出に応じた保存処理、または、紙の文書または電子文書の紙へのコピー複写でもよい。
上記装置を構築するために、システム管理者が、キーワードパターンの語彙リストや他のセットアップパラメータを入力できる構成ファイルを生成する。ワードパターンは、語、節、符号またはデータパターンの他の任意の組み合わせを含んでいてもよい。他の構成ファイルは、「プロセス定義」または行われる動作を含む。これらのプロセス定義は、バッチファイル、スクリプトまたは実行可能事項の形状でもよい。第3構成ファイルは、上記2つの間の対応付けを行う。対応付けファイルにより、ユーザは、キーワードの組み合わせが検出されるとき、何が実行されるかを制御できる。
プリントされた文書の内容をチェックする方法は、プリンタコントローラー(制御装置)に実装されたソフトウエアを利用する。この方法によって、プリンタコントローラーのソフトウエアは、プリントされた文書を監視でき、例えば無許可文書がプリントされるときに、システム管理者に知らせることができる。概して、CPU時間は、プリンタよりもホストPCにおいて安価である。ある例では、評価機能を実行するのはPCである。しかし、上級ユーザは、プリンタドライバを通してその経路をハッキングし、その内容をプリンタへ送れる可能性がある。それゆえ、評価機能は、通常、プリンタ101によって実行されている。
プリンタコントローラーソフトウエアは、プリンタコントローラーに実装されているソフトウエア構成要素である(翻訳部104、図1参照)。また、プリンタコントローラーソフトウエアは、プリントドドライバによって送られたプリントジョブを、プリンタが出力(例えば、紙のページ)として使用するラスタ化イメージに翻訳する。プリントジョブは、一般的に、プリンタがサポートする特有のPDLにフォーマットされている。大抵のレーザーおよびインクジェットプリンタがサポートしている最も一般的なプリンタ言語は、ポストスクリプトおよびPCLである。これらの言語は、異なるバージョンで出現するが、プリントデータに対する原理的な1セットのコマンド(命令)をそれぞれ含んでいる。
特定のテキストを含む文書をフィルタ除去するために、適切なPDLの翻訳部102は、入力プリントジョブを個々の言語構成要素に構文解析する。翻訳部102は、プリントされる文書テキストの一部であるこれらの言語構成要素を識別し、このデータを一時的に保持するバッファ118へ保存する。構文解析系が、文書にある全てのテキストデータを抽出した後、翻訳部102が、バッファ118にあるデータをスキャンして、データが構成ファイルからの、定義された1つ以上の制御列を含んでいるかどうかを検証する。構成ファイルと照合するキーワードを含む文書が見出された場合、プリンタコントローラーは、構成ファイルにおいて定義された適切な動作を実行する。これらの動作は、以下(a)〜(g)のいずれかの動作を含んでいてもよい。すなわち、
(a)レポートの送信−管理者が選択したリストの受信者に通知メッセージを送る。メッセージは、スキャン結果の詳しいレポートやプリントジョブのコピーを含んでいてもよい。この動作により、システム管理者は、無許可プリントを監視できる。
(b)プリントジョブの阻止−無許可コンテンツが検出された場合、プリントを停止する。
(c)レポートの記録−スキャン結果およびプリントジョブの詳しいレポートを、将来的な参照用に記録する。記録されるデータの記録場所は、管理者が定め、プリント装置、ホスト機、またはネットワーク化されたサーバーでもよい。
(d)部門または表題により評価する在庫管理データベースの更新
(e)将来的な監査/追跡のためのプリント/スキャンジョブの保存
(f)バッチ/実行可能ファイルの実行
(g)上記の任意の組み合わせ
の動作である。
システム管理者が、無許可文書のプリントを阻止したい場合、実際にプリントが開始される以前に、翻訳部によって文書全体を構文解析し検証する必要がある。しかし、管理者が通知動作のみを選択していた場合、プリント性能に影響が及ばないように、プリントジョブが完了した後で、文書の検証が行われる。
図3(a)および図3(b)は、ポストスクリプトプリントジョブの一例を示す。この例では、テキスト部分が可読フォーマットであり、太字と認識される。ポストスクリプト言語は、暗号化データもサポートしている。暗号化データを含むポストスクリプトプリントジョブのために、ポストスクリプト翻訳部は、構文解析を行なう以前に、データを解読する。ポストスクリプト構文解析系(評価部)は、文書のテキスト部分を識別でき、これらのテキスト部分を、バッファに保存する。埋設されたソフトウエアは、ユーザが定義したコンテンツの全てをスキャンし、照合が見出された場合、適切な動作を行う。
本発明は、必ずしもテキスト専用ではない文書にも応用できる。他の例では、プロセスされる文書が、ビットマップ、または、構文解析できる形状のテキストを含んでいない任意の他のジョブでもよい。この場合、プリンタおよびプリンタ装置は、PDLからテキストを抽出できない。このような性質の文書にさえ、システム多目的プリント処置を実現できる。
文書が、ビットマップ専用である場合、さらに、1つの前の処理ステップを行う。ビットマップイメージに対してOCR操作を行ない、OCRプロセスの出力を、可能な照合のための語彙項目のライブラリに反して構文解析する。照合が見出された場合、非ビットマップ(テキスト)PDLに対して行うのと同じステップを行う。OCRプロセスは、プリンタ自体で実行されてもよい。
1つの例としては、本発明の方法が、ファックス機を介して受信または送信された文書に応じて、動作(実行可能事項)を指図してもよい。同じ処理を、スキャナーまたはコピー機に適用できる。他の例として、誰かが新規に仕事を探している場合にレポートを受信したい偏執的な管理者を想定する。この管理者は、「履歴書」または「就職申込」などのキーワードを入力し、検出時に、プリント/スキャンジョブを所定期間保持するか、または、この管理者にその仕事を電子メールで送信するように装置に要求することができる。
図4は、本実施形態のプリンタ101の処理動作を示すフローチャートである。以下のフローチャートでは、各処理について、一連のステップとして番号を付けて示したが、特に記載しない限り、番号付けから順序を推論すべきではない。これらのステップの複数を省略しても、並行して実行しても、順序を守らずに実行してもかまわない。このフローは、ステップ400(S400)から始まる。
ステップ402では、語彙項目のライブラリ110を構築する。次にステップ404では、実行可能プログラムのライブラリを構築する。次にステップ406では、語彙項目と実行可能プログラムのとを対応付ける。語彙項目のライブラリは予め構築されていてもよいし、ユーザが構築してもよい。また、実行プログラムのライブラリは予め構築されていてもよいし、ユーザが構築してもよい。また、語彙項目と実行可能プログラムとの対応付けは、予め行われていてもよいし、ユーザが対応付けてもよい。
そして、ステップ408では、プリンタ処理のために文書を受け付ける。ステップ410では、プリントコンテンツに応じて文書を評価する。つまり、ステップ410では、文書中のプリントコンテンツに含まれる語彙を、語彙項目のライブラリ110にある語彙項目と照合する。そして、照合された語彙項目に対応付けられた実行プログラムを選択する。
ステップ412では、ステップ410選択した実行可能プログラムを実行する。ステップ412では、照合した語彙項目との対応付けられた実行可能ファイルを実行する。
また、他の例では、ステップ402が、キーワード、符号、ワードパターンまたはデータパターンなどの語彙項目のライブラリを構築するステップを含んでいてもよい。上記のように、これは、考えられる項目の唯一のリストではない。同じく、ステップ404は、受信者への文書のレポートの送信、文書プリント処理の阻止、文書プリント処理の記録、データベースの更新、文書の保存、付加文書処理を開始するためのプログラムの実行、または付加文書処理を開始するための複数のプログラムの実行、等のような実行可能プログラムのライブラリを構築するステップを含んでいてもよい。同じく、これは、実行可能事項の唯一のリストではない。
また、別の例では、プリンタ処理のために文書を受け付けるステップ408が、サブステップを含んでいてもよい。ステップ408aは、プリンタドライバ120が出力ファイルを生成する。ステップ408aでは、PCLまたはポストスクリプトなどのページ記述言語ファイルを生成してもよい。ステップ408bは、プリンタドライバ120の出力ファイルを、ラスタ化イメージに翻訳する。また、文書の中のプリントコンテンツに含まれる語彙を語彙項目のライブラリ110にある語彙項目と照合するステップ410が、サブステップを含んでいてもよい。ステップ410aでは、ラスタ化イメージを、言語構成要素に構文解析する。ステップ410bでは、プリントされるデータを表す言語構成要素を識別する。ステップ410cでは、プリントされるデータを保存する。ステップ410dは、語彙項目のために保存したデータを試験する。
また、別の例は、上記フローが付加ステップを含んでいてもよい。例えば、ステップ407aでは、ビットマップ文書を受け付ける。ステップ407bでは、ビットマップ文書に対して光学的特性認識(COR)を実行する。ステップ407cでは、テキスト列を生成する。この場合、ステップ408では、生成されたテキスト列を受け付けるステップを含む。
また、他の例では、付加ステップ、すなわち、ステップ414では、スキャン、ファックス、伝送、保存および紙のコピー複写を含むグループから選択した処理を使用して文書を処理する。この付加処理は、文書内容の評価に応じて、ユーザによって意図されるものであっても、および/または、ユーザが意図する業務と並行して行われるものであってもよい。
以上の様に、本実施の形態の文書処理装置100は、文書の内容に応じて文書を管理することができる。
ここで、上記文書処理装置100は、汎用のコンピュータをベースに構成できる。すなわち、上記の文書処理装置100は、その機能を実現するプログラム(情報処理機器の制御プログラム、認証機器の制御プログラム)の命令を実行するCPU(central processing unit)、ブートロジックを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データベースを格納する不揮発性メモリ等の記憶装置(記録媒体)、キーやボタン等の入力機器、モニタ、スピーカー等の出力機器、外部のネットワークに接続するネットワーク接続機器が、内部バスによって接続されて構成されている。
そして、文書処理装置100の各種機能、各種処理は、上記各部の機能を実現する制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を文書処理装置100に供給し、CPUが記録媒体に記録されているプログラムコードを読み出し実行することによって実現可能である。具体的には、文書処理装置100が備える、制御装置等は、当該機器のメモリ(図示せず)に格納された所定のプログラムを、CPUなどが実行することにより実現される。なお、上記の各ブロックは、その一部あるいは全部をハードウェアロジックによって構成してもよい。
上記プログラムコードを供給するための記録媒体は、文書処理装置100本体と分離可能に構成することができる。また、上記記録媒体は、プログラムコードを供給可能であるように固定的に担持する媒体であってもよい。そして、上記記録媒体は、記録したプログラムコードをコンピュータが直接読み取ることができるように文書処理装置100に装着されるものであっても、外部記憶装置として文書処理装置100に接続されたプログラム読み取り装置を介して読み取ることができるように装着されるものであってもよい。
例えば、上記記録媒体としては、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
また、上記プログラムコードは、コンピュータが記録媒体から読み出して直接実行できるように記録されていてもよいし、記録媒体から主記憶のプログラム記憶領域へ転送された後コンピュータが主記憶から読み出して実行できるように記録されていてもよい。
さらに、文書処理装置100を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。そして、通信ネットワークとしては、特に限定されず、具体的には、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、具体的には、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された搬送波あるいはデータ信号列の形態でも実現され得る。
なお、プログラムコードを記録媒体から読み出して主記憶に格納するためのプログラム、および、通信ネットワークからプログラムコードをダウンロードするためのプログラムは、コンピュータによって実行可能にあらかじめ文書処理装置100に格納されているものか、あるいは別な記録媒体からインストールされるものとする。
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
なお、本発明は、文書のプリントコンテンツに応じたプリンタ装置の制御方法であって、プリンタ処理のために文書を受け付けるステップと、文書のプリントコンテンツを評価するステップと、プリントコンテンツの評価に応じてプログラムを実行するステップとを含むプリンタ装置の制御方法であってもよい。
また、上記制御方法は、語彙項目のライブラリを構築するステップをさらに含み、上記文書にあるプリントコンテンツを評価するステップが、文書にあるプリントコンテンツをライブラリにある語彙項目と照合するステップを含んでもよい。
また、上記制御方法は、実行可能プログラムのライブラリを構築するステップと、上記語彙項目のライブラリと上記実行可能プログラムのライブラリとを対応付けるステップとをさらに含み、上記プリントコンテンツ評価に応じてプログラムを実行するステップが、照合した語彙項目と実行可能プログラムとの対応付けに応じて実行可能ファイルを選択するステップを含んでもよい。
また、上記制御方法では、上記語彙項目のライブラリを構築するステップは、キーワード、符号、ワードパターンおよびデータパターンを含むグループから選択された語彙項目のライブラリを構築するステップを含んでもよい。
また、上記制御方法では、上記プリンタ処理のために文書を受け付けるステップは、プリンタドライバ出力ファイルを生成するステップと、プリンタドライバ出力ファイルを、ラスタ化イメージに翻訳するステップとを含み、上記文書にあるプリントコンテンツをライブラリにある語彙項目と照合するステップは、ラスタ化イメージを、言語構成要素に構文解析するステップと、プリントされるデータを表す言語構成要素を識別するステップと、プリントされるデータを一時保存するステップと、語彙項目のために一時保存されたデータを試験するステップとを含んでもよい。
また、上記制御方法では、プリンタドライバ出力ファイルを生成するステップは、プリンタ制御言語(PCL)とポストスクリプトとを含むグループから選択されたページ記述言語ファイルを生成するステップを含んでもよい。
また、上記制御方法では、上記実行可能プログラムのライブラリを構築するステップは、受信者への文書のレポートの送信、文書プリントプロセスの阻止、文書プリントプロセスの記録、データベースの更新、文書の所定時間保存、付加文書プロセッシングを開始するためのプログラムの実行および付加文書処理を開始するための複数のプログラムの実行を含むグループから選択された実行可能プログラムのライブラリを構築するステップを含んでもよい。
また、上記制御方法は、ビットマップ文書を受け付けるステップと、ビットマップ文書に対して光学的特性認識(OCR)を実行するステップと、テキスト列を生成するステップとをさらに含み、上記プリンタ処理のために文書を受け付けるステップが、生成されたテキスト列を受け付けるステップを含んでもよい。
また、上記制御方法は、スキャン、ファックス、保存、伝送および紙のコピー複写を含むグループから選択された処理を使用して文書を処理するステップをさらに含んでもよい。
また、本発明は、文書のプリントコンテンツに応じたプリンタ装置の制御方法において、語彙項目のライブラリを構築するステップと、実行可能プログラムのライブラリを構築するステップと、語彙項目のライブラリと実行可能プログラムのライブラリとを対応付けるステップと、プリンタ処理のために文書を受け付けるステップと、上記文書にあるプリントコンテンツを評価するステップと、照合された語彙項目と実行可能プログラムとの対応付けに応じて実行可能ファイルを選択するステップとを含むプリンタ装置の制御方法であってもよい。
また、本発明は、文書のプリントコンテンツに応じたプリンタ装置の制御装置であって、プリントドライバ出力ファイルを受け付ける入力部と、プリンタ処理のために翻訳された文書を供給する出力部とを有する翻訳手段と、翻訳された文書を受け付けるインターフェースを有し、翻訳された文書にあるプリントコンテンツを評価し、プリントコンテンツの評価に応じて実行するためのプログラムを選択する評価手段とを備えるプリンタ装置の制御装置であってもよい。
また、上記制御装置は、上記評価手段のインターフェースと接続されているインターフェースを有する語彙項目のライブラリをさらに有し、翻訳された文書にあるプリントコンテンツをライブラリにある語彙項目と照合するために、上記評価手段が、上記語彙項目のライブラリへアクセスしてもよい。
また、上記制御装置は、上記評価手段のインターフェースと接続されているインターフェースを有する実行可能プログラムのライブラリと、上記評価手段インターフェースと接続されているインターフェースを有し、実行可能ファイルを有する語彙項目を相互参照する対応付けライブラリとをさらに備え、語彙項目のライブラリからの語彙項目とプリントコンテンツの照合に応じて実行可能プログラムのライブラリから実行可能ファイルを選択するために、評価手段が対応付けライブラリへアクセスしてもよい。
また、上記制御装置では、上記語彙項目のライブラリが、キーワード、符号、ワードパターンおよびデータパターンを含むグループから選択された項目を含んでもよい。
また、上記制御装置は、評価手段のインターフェースと接続されているインターフェースを有するバッファをさらに備え、上記翻訳手段が、プリンタドライバ出力ファイルを、ラスタ化イメージに翻訳し、評価手段が、ラスタ化イメージを、言語構成要素に構文解析し、プリントされるデータを表す言語構成要素を識別して、プリントされるデータを上記バッファに格納し、語彙項目のために一時保存されたデータを試験してもよい。
また、上記制御装置は、文書を受け付ける入力部とプリントドドライバ出力ファイルを供給する出力部とを有するプリントドライバをさらに備えてもよい。
また、上記制御装置は、プリントドライバが、プリンタ制御言語(PCL)とポストスクリプトとを含むグループから選択されたページ記述言語で生成された出力ファイルを供給してもよい。
また、上記制御装置は、実行可能プログラムのライブラリが、受信者への文書のレポートの送信、文書プリントプロセスの阻止、文書プリント処理の記録、データベースの更新、文書の保存、付加文書処理を開始するためのプログラムの実行、および付加文書処理を開始するための複数のプログラムの実行を含むグループから選択されたプログラムを含んでもよい。
また、上記制御装置は、ビットマップ文書を受け付ける入力部とビットマップ文書に対して実行するOCR操作の結果生じるテキスト列を供給する出力部とを有する光学的特性認識(OCR)ユニットをさらに備え、プリントドライバが、プリントプロセッシングのために生成されたテキスト列を受け付けてもよい。
また、上記制御装置は、プリントドライバ出力を受け付ける入力部とスキャン、ファックス、保存、伝送および紙のコピー複写を含むグループから選択された処理を使用して処理された文書を供給する出力部とを有するプリントプロセッサーをさらに備えてもよい。
本願発明は、例えば、多機能周辺装置(MFP、Multifunctional peripheral)、レーザープリンタ、インクジェットプリント装置またはファックス機などのプリント装置で行う文書のプリントまたはスキャンに応じて、プリントコンテンツに基づいた文書管理動作を行う文書処理装置、文書処理方法、文書処理装置の制御プログラムおよび記録媒体および方法に好適に利用することができる。
本発明の一実施形態である文書処理装置の要部構成を示すブロック図である。 図1のメモリをより詳しく描画した図である。 (a)および(b)は、ポストスクリプトプリントジョブの一例を示す図である。 本実施形態の文書処理装置の処理動作を示すフローチャートである。
符号の説明
100 文書処理装置
102 翻訳部(翻訳手段)
108 評価部(評価手段)
110 語彙項目のライブラリ
112 メモリ(記憶部)
114 実行可能プログラムのライブラリ
116 対応付けライブラリ
120、126 プリントドライバ(ページ記述言語データ生成手段)
130 OCRユニット(テキスト列生成手段)
136a プリントプロセッサー(プリント処理手段)
140 プログラム実行部(プログラム実行手段)

Claims (10)

  1. テキストデータに含まれる語彙と該テキストデータを処理する出力プログラムとの対応関係を記憶する記憶部と、
    テキストデータから語彙を抽出し、上記記憶部に格納された上記対応関係に基づいて、当該テキストデータを処理する出力プログラムを選択する評価手段と、
    上記テキストデータを上記評価手段によって選択された出力プログラムにより処理するプログラム実行手段を有することを特徴とする文書処理装置。
  2. ページ記述言語データから上記テキストデータを生成し上記評価手段に供給する翻訳手段を有することを特徴とする請求項1に記載の文書処理装置。
  3. 上記語彙が、予め設定された文字列であることを特徴とする請求項1または2に記載の文書処理装置。
  4. 取得した文書データをページ記述言語データに生成し、上記翻訳手段に供給するページ記述言語データ生成手段を備えることを特徴とする請求項2〜4の何れか1項に記載の文書処理装置。
  5. 上記ページ記述言語データ生成手段は、取得した文書データをプリンタ制御言語とポストスクリプトとの何れかのページ記述言語データに生成することを特徴とする請求項4に記載の文書処理装置。
  6. ビットマップ文書に対して光学的特性認識操作を実行しテキスト列からなる文書データを生成するテキスト列生成手段を備え、
    上記ページ言語データ生成手段は、上記テキスト列生成手段からテキスト列よりなる文書データを取得する請求項4または5に記載の文書処理装置。
  7. 上記プログラム実行手段が上記翻訳手段により上記ページ記述言語データから生成されたテキストデータを処理する際に、上記ページ記述言語データに対し、スキャン、ファックス、保存、伝送および紙への複写、のうちの少なくとも1つの処理を行うプリント処理手段を備えることを特徴とする請求項2〜6の何れか1項に記載の文書処理装置。
  8. テキストデータに含まれる語彙と該テキストデータを処理する出力プログラムとの対応関係を記憶する記憶部を備えた装置における文書処理方法であって、
    テキストデータから語彙を抽出し、上記記憶部に格納された上記対応関係に基づいて、当該テキストデータを処理する出力プログラムを選択する評価ステップと、
    上記テキストデータを上記評価ステップによって選択された出力プログラムにより処理するプログラム実行ステップとを有することを特徴とする文書処理方法。
  9. 上記請求項1〜7の何れか1項に記載の文書処理装置を動作させる制御プログラムであって、上記各手段をコンピュータに実現させることを特徴とする文書処理装置の制御プログラム。
  10. 請求項9に記載の文書処理装置の制御プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2004208465A 2003-07-18 2004-07-15 文書処理装置、文書処理方法、文書処理装置の制御プログラムおよびコンピュータ読み取り可能な記録媒体 Pending JP2005044356A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/622,199 US7446895B2 (en) 2003-07-18 2003-07-18 Print content system and method for providing document control

Publications (1)

Publication Number Publication Date
JP2005044356A true JP2005044356A (ja) 2005-02-17

Family

ID=34063159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004208465A Pending JP2005044356A (ja) 2003-07-18 2004-07-15 文書処理装置、文書処理方法、文書処理装置の制御プログラムおよびコンピュータ読み取り可能な記録媒体

Country Status (2)

Country Link
US (1) US7446895B2 (ja)
JP (1) JP2005044356A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007257552A (ja) * 2006-03-24 2007-10-04 Ricoh Co Ltd 印刷ログ及び印刷データ保存によるセキュリティ管理システム

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3654360B2 (ja) * 2002-12-02 2005-06-02 ソニー株式会社 制御システムおよび方法、情報処理装置および方法、情報処理端末および方法、記録媒体、並びにプログラム
US20060007474A1 (en) * 2004-07-09 2006-01-12 Daos Brenda F System and method for routing document processing operations
US8600989B2 (en) 2004-10-01 2013-12-03 Ricoh Co., Ltd. Method and system for image matching in a mixed media environment
US8510283B2 (en) 2006-07-31 2013-08-13 Ricoh Co., Ltd. Automatic adaption of an image recognition system to image capture devices
US8176054B2 (en) 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
US7812986B2 (en) * 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US9530050B1 (en) 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US8335789B2 (en) 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
US8184155B2 (en) 2007-07-11 2012-05-22 Ricoh Co. Ltd. Recognition and tracking using invisible junctions
US8949287B2 (en) 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US7970171B2 (en) 2007-01-18 2011-06-28 Ricoh Co., Ltd. Synthetic image and video generation from ground truth data
US8521737B2 (en) 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
US8144921B2 (en) 2007-07-11 2012-03-27 Ricoh Co., Ltd. Information retrieval using invisible junctions and geometric constraints
US8086038B2 (en) 2007-07-11 2011-12-27 Ricoh Co., Ltd. Invisible junction features for patch recognition
US9384619B2 (en) 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US8838591B2 (en) 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
US8385589B2 (en) 2008-05-15 2013-02-26 Berna Erol Web-based content detection in images, extraction and recognition
US8332401B2 (en) 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US8195659B2 (en) 2005-08-23 2012-06-05 Ricoh Co. Ltd. Integration and use of mixed media documents
US9171202B2 (en) 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US9373029B2 (en) 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
US8989431B1 (en) 2007-07-11 2015-03-24 Ricoh Co., Ltd. Ad hoc paper-based networking with mixed media reality
US8156427B2 (en) * 2005-08-23 2012-04-10 Ricoh Co. Ltd. User interface for mixed media reality
US8868555B2 (en) 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US8856108B2 (en) 2006-07-31 2014-10-07 Ricoh Co., Ltd. Combining results of image retrieval processes
US9405751B2 (en) 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US8825682B2 (en) 2006-07-31 2014-09-02 Ricoh Co., Ltd. Architecture for mixed media reality retrieval of locations and registration of images
US8276088B2 (en) 2007-07-11 2012-09-25 Ricoh Co., Ltd. User interface for three-dimensional navigation
US8369655B2 (en) 2006-07-31 2013-02-05 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US7475335B2 (en) * 2004-11-03 2009-01-06 International Business Machines Corporation Method for automatically and dynamically composing document management applications
US20070002365A1 (en) * 2005-06-29 2007-01-04 Xerox Corporation Tools for distributed printing of documents
JP2007028507A (ja) * 2005-07-21 2007-02-01 Fuji Xerox Co Ltd 画像形成システムおよび方法
US20070115498A1 (en) * 2005-11-18 2007-05-24 The Go Daddy Group, Inc. Relevant messages associated with incoming fax documents
US20070115512A1 (en) * 2005-11-18 2007-05-24 The Go Daddy Group, Inc. Relevant messages associated with outgoing fax documents
US9176984B2 (en) 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
US9020966B2 (en) 2006-07-31 2015-04-28 Ricoh Co., Ltd. Client device for interacting with a mixed media reality recognition system
US8676810B2 (en) 2006-07-31 2014-03-18 Ricoh Co., Ltd. Multiple index mixed media reality recognition using unequal priority indexes
US8201076B2 (en) 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US8489987B2 (en) * 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US8073263B2 (en) * 2006-07-31 2011-12-06 Ricoh Co., Ltd. Multi-classifier selection and monitoring for MMR-based image recognition
US9063952B2 (en) 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
JP2009048250A (ja) * 2007-08-14 2009-03-05 Japan Lucida Co Ltd 機器データ管理システム
US8385660B2 (en) 2009-06-24 2013-02-26 Ricoh Co., Ltd. Mixed media reality indexing and retrieval for repeated content
US9785385B2 (en) 2010-05-18 2017-10-10 Ricoh Company, Ltd. Mechanism for tracking printer resource objects
US10901665B2 (en) 2011-06-27 2021-01-26 International Business Machines Corporation Workgroup management of categorized print jobs
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
US20140222762A1 (en) * 2011-12-28 2014-08-07 Michael F. Fallon Automated document archive for a document processing unit
WO2013100943A1 (en) * 2011-12-28 2013-07-04 Intel Corporation Document policies for a document processing unit
US11405513B2 (en) 2020-07-31 2022-08-02 Kyocera Document Solutions, Inc. Printer control automation from document annotation
CN112988088A (zh) * 2021-03-05 2021-06-18 珠海奔图电子有限公司 图像形成控制方法、装置及系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5729665A (en) * 1995-01-18 1998-03-17 Varis Corporation Method of utilizing variable data fields with a page description language
US6163383A (en) * 1996-04-17 2000-12-19 Fuji Xerox Co., Ltd. Method for providing print output security in a multinetwork environment
DE19633724A1 (de) * 1996-08-21 1998-02-26 Baasel Scheel Lasergraphics Gm Kopiergeschützter Sicherheitsdruck
US5978477A (en) * 1996-11-21 1999-11-02 Ricoh Company Limited Automatic and transparent document archiving
JPH10161823A (ja) * 1996-11-27 1998-06-19 Nec Corp 印刷システム
US6100998A (en) * 1996-11-29 2000-08-08 Fuji Xerox Co., Ltd. Print processor with efficient memory use
JP2000253241A (ja) 1999-02-26 2000-09-14 Matsushita Electric Ind Co Ltd データ監視方法、およびデータ監視装置
EP1098266A3 (en) * 1999-11-02 2003-01-22 Canon Kabushiki Kaisha Print control method and apparatus
US6666595B2 (en) * 2001-05-08 2003-12-23 Hewlett-Packard Development Company, Lp System and methods for protecting printer consumables through positioning non-use zones
US20030233366A1 (en) * 2002-06-17 2003-12-18 Aspetuck Systems Inc. Database monitoring system with formatted report information delivery
US20040193910A1 (en) * 2003-03-28 2004-09-30 Samsung Electronics Co., Ltd. Security filter for preventing the display of sensitive information on a video display

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007257552A (ja) * 2006-03-24 2007-10-04 Ricoh Co Ltd 印刷ログ及び印刷データ保存によるセキュリティ管理システム

Also Published As

Publication number Publication date
US7446895B2 (en) 2008-11-04
US20050012960A1 (en) 2005-01-20

Similar Documents

Publication Publication Date Title
JP2005044356A (ja) 文書処理装置、文書処理方法、文書処理装置の制御プログラムおよびコンピュータ読み取り可能な記録媒体
US8390867B2 (en) Form generation system and form generation method
JP4704010B2 (ja) 画像形成装置、画像形成システム、セキュリティ管理装置およびセキュリティ管理方法
US8243320B2 (en) Document management apparatus, control method therefor, computer program, and storage medium
US8427674B2 (en) Information processing apparatus with template control of process flow in a print device
US7760378B2 (en) Printer server, client terminal, image forming apparatus, print data generating method, and computer product
US8593665B2 (en) Image forming system and information processing apparatus
US8817276B2 (en) Image processing apparatus and data processing method for managing log information related to a job processing request
US20090296146A1 (en) Managing apparatus, image processing apparatus, and processing method for the same
US20100246962A1 (en) Information processing system, information processing method, image processing apparatus, program, and recording medium
JP2006085356A (ja) 組み込み装置およびその制御方法
JP5004142B2 (ja) 文書管理システム、画像処理装置、情報処理装置、文書管理方法、制御方法およびプログラム。
US8045228B2 (en) Image processing apparatus
JP2007034847A (ja) 検索装置及び検索方法
JP2008210346A (ja) 画像処理システム及びプログラム
JP4655842B2 (ja) ログ情報管理システム及びログ情報管理方法
US7573594B2 (en) Methods and systems for document reproduction management
US8294928B2 (en) Data management system to extract text data
US7978350B2 (en) Copyright compliance
JP4340482B2 (ja) 文書管理システム
JP4790043B2 (ja) 画像処理装置およびその制御方法
JP2010136141A (ja) 文書処理システムおよび文書処理方法
JP2003266863A (ja) 印刷システム及び印刷装置
JP2007045151A (ja) 印刷物の印刷者を特定する方法、印刷管理メディア及び画像形成システム
JP2009188651A (ja) 画像処理装置と画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060912

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080617

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080804

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080804

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080826

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081006

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081104