JP2008271542A - ドキュメント処理装置のオーディオビジュアル制御システムおよび方法 - Google Patents

ドキュメント処理装置のオーディオビジュアル制御システムおよび方法 Download PDF

Info

Publication number
JP2008271542A
JP2008271542A JP2008096519A JP2008096519A JP2008271542A JP 2008271542 A JP2008271542 A JP 2008271542A JP 2008096519 A JP2008096519 A JP 2008096519A JP 2008096519 A JP2008096519 A JP 2008096519A JP 2008271542 A JP2008271542 A JP 2008271542A
Authority
JP
Japan
Prior art keywords
document processing
level
processing operation
user
available
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008096519A
Other languages
English (en)
Inventor
Man M Garg
モハン ガーグ,マン
Sodhi Ajit
ソーディ,アジィト
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba TEC Corp
Original Assignee
Toshiba Corp
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba TEC Corp filed Critical Toshiba Corp
Publication of JP2008271542A publication Critical patent/JP2008271542A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/038Control and interface arrangements therefor, e.g. drivers or device-embedded control circuitry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/038Indexing scheme relating to G06F3/038
    • G06F2203/0381Multimodal input, i.e. interface arrangements enabling the user to issue commands by simultaneous use of input devices of different nature, e.g. voice plus gesture on digitizer

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Facsimiles In General (AREA)
  • User Interface Of Digital Computer (AREA)
  • Accessory Devices And Overall Control Thereof (AREA)

Abstract

【課題】ドキュメント処理装置のオーディオビジュアル制御システムおよび方法を提供する。
【解決手段】先ず、それぞれがドキュメント処理装置で利用可能な第1のレベルのドキュメント処理動作を表す第1のレベルのグラフィック画像が、ディスプレイ上に表示される。次に、ユーザによって選択された第1のレベルの動作の第1の可聴音声情報が受け取られる。受け取られた第1の可聴情報にしたがって、選択された第1のレベルの動作が特定される。続いて、それぞれが選択された第1のレベルの動作に対応する第2のレベルのドキュメント処理動作を表す第2のレベルの画像がディスプレイ上に表示される。次に、ユーザによって選択された第2のレベルの動作の第2の可聴音声情報が受け取られる。選択された第2のレベルの動作は、受け取られた第2の可聴音声情報にしたがって特定される。次いで、特定された第1のレベルの動作および第2のレベルの動作にしたがって、ドキュメント処理動作が開始される。
【選択図】図6

Description

本発明は、ドキュメント処理装置の制御システムおよび方法に関し、特に、ドキュメント処理装置のオーディオビジュアル制御システムおよび方法に関する。
ドキュメント処理装置は、コピー、印刷、ファクシミリ送信、画像走査、電子メールおよび保存といった機能を備えている。これらの機能をはじめ、ドキュメント処理装置への追加が続けられる新たな機能は、多機能周辺装置(Multi-Function Peripheral;以下、MFPということがある。)と呼ばれる一つの装置に一体化されることが多い。
ドキュメント処理装置の制御または操作に関連する多くの様々なオプションがあることから、最近のドキュメント処理はグラフィカル・ユーザ・インターフェイス(以下、GUIということがある。)を備えることが多い。GUIは、多様な機能または制御の視覚的描写を提供することができる。タッチ・スクリーンを用いた実施形態においては、ユーザが、それらの機能を閲覧し、対応するアイコンに触れることによって所望の機能を選択することができる。
一方、音声認識技術における進歩は、音声制御を採用する製品も生み出している。音声制御は特定の応用に有効である。しかしながら、その他の応用については、比較的伝統的なGUIの方がより適合することがある。また、ユーザは、1つのタイプのインターフェイスを他方のタイプのインターフェイスより好むか、多様な機能の制御について異なる好みを有することがある。
したがって、GUI技術と音声認識技術とを用いたハイブリッド形の、ドキュメント処理装置の制御システムおよび方法が望まれている。
本発明は、上記の従来の問題点に鑑みてなされたもので、ドキュメント処理装置のオーディオビジュアル制御システムおよび方法を提供することを目的とする。
本発明によるドキュメント処理装置のオーディオビジュアル制御システムは、可聴情報を認識し、認識された可聴情報にしたがってドキュメント処理動作を特定する認識手段と、それぞれが複数の利用可能な第1のレベルのドキュメント処理動作のうちの少なくとも1つを一意的に表す複数の第1のレベルのグラフィック画像を、ディスプレイ端末上に表示する手段とを有する。また本システムは、利用可能な第1のレベルのドキュメント処理動作のうちの選択された1つに対応する第1の可聴情報(audible information)をユーザから受け取る手段と、認識手段に含まれ、受け取られた第1の可聴情報にしたがって利用可能な第1のレベルのドキュメント処理動作のうちの選択された1つのドキュメント処理動作を特定する手段を有する。本システムは、さらに、それぞれが選択された第1のレベルのドキュメント処理動作に対応する複数の利用可能な第2のレベルのドキュメント処理動作のうちの少なくとも1つを一意的に表す複数の第2のレベルのグラフィック画像を、ディスプレイ端末上に表示する手段を有する。さらに本システムは、利用可能な第2のレベルのドキュメント処理動作のうちの選択された1つに対応する第2の可聴情報をユーザから受け取る手段と、認識手段に含まれ、受け取られた第2の可聴情報にしたがって利用可能な第2のレベルのドキュメント処理動作のうちの選択された1つのドキュメント処理動作を特定する手段とを有する。さらに本システムは、認識手段の出力にしたがってドキュメントに対してドキュメント処理動作を開始する手段を有する。
本発明による一実施形態においては、本システムは、選択された第1のレベルのドキュメント処理動作および第2のレベルのドキュメント処理動作のそれぞれに対応する非可聴ユーザ選択データを受け取る手段を、さらに、有する。
本発明による、別の実施形態においては、開始されるそれぞれのドキュメント処理動作は、第1のレベルのドキュメント処理動作のみの実行を含む。
本発明による追加の実施形態においては、第1のレベルのドキュメント処理動作が、コピー、または印刷、またはファクシミリ送信、または電子メール送信、または画像走査、または保存処理動作を含む。
また本発明によるさらに別の実施形態においては、第2のレベルのドキュメント処理動作は、ステープル、または孔開け(パンチ)、または丁合い、または用紙サイズの選択、またはページの向き、またはページ設定、または出力パレットの選択、または出力先、または解像度、または料金の会計処理動作を含む。好ましくは認識手段が、可聴的に受け取られた料金の会計情報に関するアカウント・データを特定する手段を含む。
本発明によるドキュメント処理装置のオーディオビジュアル制御方法は、それぞれが複数の利用可能な第1のレベルのドキュメント処理動作のうちの少なくとも1つを一意的に表す複数の第1のレベルのグラフィック画像を、ディスプレイ端末上に表示するステップと、利用可能な第1のレベルのドキュメント処理動作のうちの選択された1つに対応する第1の可聴情報をユーザから受け取るステップと、受け取られた第1の可聴情報にしたがって利用可能な第1のレベルのドキュメント処理動作のうちの選択された1つのドキュメント処理動作を特定するステップと、それぞれが選択された第1のレベルのドキュメント処理動作に対応する利用可能な第2のレベルのドキュメント処理動作のうちの少なくとも1つを一意的に表す第2のレベルのグラフィック画像をディスプレイ端末上に表示するステップと、利用可能な第2のレベルのドキュメント処理動作のうちの選択された1つに対応する第2の可聴情報をユーザから受け取るステップと、受け取られた第2の可聴情報にしたがって利用可能な第2のレベルのドキュメント処理動作のうちの選択された1つのドキュメント処理動作を特定するステップと、選択された1つの第1のレベルのドキュメント処理動作を特定するステップおよび選択された1つの第2のレベルのドキュメント処理動作を特定するステップの出力にしたがってドキュメントに対してドキュメント処理動作を開始するステップとを含む。
本発明によれば、ドキュメント処理装置のオーディオビジュアル制御システムおよび方法が提供される。
以下、適宜、図面を参照しながら本発明による実施形態の説明を行う。図1Aに本発明による実施形態が適用されるオーディオビジュアル・ドキュメント処理装置制御システム全体の構成例を示す。図に示したシステム100は、コンピュータ・ネットワーク102として表されている分散コンピューティング環境を利用している。コンピュータ・ネットワーク102は、複数の電子装置間におけるデータの交換を可能とする本技術分野で知られている任意の分散通信システムである。コンピュータ・ネットワーク102は、例えば、仮想ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、パーソナル・エリア・ネットワーク、ローカル・エリア・ネットワーク、インターネット、イントラネット、またはそれらの任意の組み合わせを含む本技術分野で知られている任意のコンピュータ・ネットワークである。本発明による一実施形態において、コンピュータ・ネットワーク102は、例えば、トークン・リング、IEEE802.11(x)、Ethernet(登録商標)またはその他の無線ベースまたは有線ベースのデータ通信メカニズム等の既存の多数のデータ転送メカニズムによって例示されるような物理レイヤおよびトランスポート・レイヤから構成される。図1Aにはコンピュータ・ネットワーク102を示したが、本発明は、本技術分野で知られているスタンドアローンの形態のシステムにおいても同様に具体化可能である。
システム100は、さらに、様々なドキュメント処理を実行するために適切な多機能周辺装置(Multi-Function Peripheral;以下、MFPということがある。)として図に表されている、少なくとも1つのドキュメント処理装置104を含む。しかし、MFPはドキュメント処理装置の一形態であって、本発明におけるドキュメント処理装置がMFPに限定されるものではない。ドキュメント処理装置における処理動作には、例えば、ファクシミリ通信、画像走査、コピー、印刷、電子メール、ドキュメント管理、またはドキュメント保存等が含まれる。本発明による一形態においては、ドキュメント処理装置104は、リモート・ドキュメント処理サービスを、外部装置あるいはネットワークに接続された装置に対して提供する。ドキュメント処理装置104は、ユーザ、あるいはネットワークに接続された装置等とやり取りするように構成された、ハードウェア、ソフトウェアおよびこれらの任意の適切な組み合わせを含んでいる。ドキュメント処理装置104の構成等については、図2および図3を参照しながら、後に説明を行う。
また、本発明による一実施形態において、ドキュメント処理装置104は、例えば、IEEE 1394あるいはUSBインターフェイスを有する各種ドライブ、多様なICメモリカード等の、複数のポータブル記憶媒体を受け入れるためのインターフェイスを備える。本発明の実施形態においては、ドキュメント処理装置104は、さらに、タッチ・スクリーン、LCD、タッチ・パネル、英数字キーパッド、スピーカ、またはマイクロフォン等のユーザ・インターフェイス106を備え、ユーザは、このようなユーザ・インターフェイスを介してドキュメント処理装置104と直接やり取りすることができる。
ここで図1Bを参照すると、ドキュメント処理装置104に関連する例示的なユーザ・インターフェイス106が示されている。本発明による一実施形態においては、ユーザ・インターフェイス106が、ユーザに情報を伝達し、ユーザから選択を受け取るために使用される。ユーザ・インターフェイス106は、本技術分野で知られているように、ユーザに対してデータを提示するように適合された多様なコンポーネントを含む。本発明による一実施形態において、後ほども説明を行うように、ユーザ・インターフェイス106は1つまたは複数のグラフィック要素、テキスト・データ、または画像等をユーザに表示し、ユーザから入力を受取り、受け取ったユーザからの入力内容をバックエンド・コンポーネント、例えばコントローラ108に伝達するように適合されたディスプレイ112を含む。ユーザ・インターフェイス106は、さらに、音声情報(speech communications)を可聴的にユーザへ送るスピーカ114、および音声情報をユーザから受け取るマイクロフォン116を含む。
図1Aに戻り、ドキュメント処理装置104は、適切な通信リンク118を介して、コンピュータ・ネットワーク102とデータ通信を行う。適切な通信リンク118としては、例えば、WiMax(Worldwide Interoperability for Microwave Access)、IEEE802.11a、IEEE802.11b、IEEE802.11g、IEEE802.11(x)、Bluetooth(登録商標)、公衆交換電話網、専用通信ネットワーク、赤外線接続、光接続、または、本技術分野において知られている他の適切な有線または無線のデータ通信チャネルがある。
本発明による一実施形態において、ドキュメント処理装置104は、さらに、図においてコントローラ108として示した、ドキュメント処理装置104による処理動作を容易にする適切なバックエンド・コンポーネントを内蔵している。コントローラ108は、ドキュメント処理装置104の動作の制御、あるいはユーザ・インターフェイス106を介した画像の表示、または、電子画像データの操作の指示、およびユーザとの間の音声情報の送受信等の処理を容易にするように構成されたハードウェア、ソフトウェアあるいはこれらの適切な組み合わせによって実装される。以下の説明においては、コントローラ108という用語は、後述する動作を実行し、もしくは実行させ、もしくは制御し、またはその他の指示を行うように機能するハードウェア、ソフトウェア、またはこれらの組み合わせを含むドキュメント処理装置104と関連する任意の多数のコンポーネントの意味で、使用する。なお、図および上記の説明において、コントローラ108をドキュメント処理装置104に内蔵された形態としたが、コントローラ108は、ドキュメント処理装置104に通信可能に接続された外部装置の形態であってもよい。コントローラ108との関連において説明を行う動作は、本技術分野において知られている任意の汎用コンピューティング・システムによって実行可能である。したがって、コントローラ108は、このような汎用コンピューティング装置を代表しており、以下の説明において使用する際にも、そのように意図されている。また、以下の説明においてはコントローラ108を使用しているが、これは実施形態の例にすぎず、その他の実施形態においても、本発明によるドキュメント処理装置のオーディオビジュアル制御のためのシステムおよび方法を実施することができる。コントローラ108の構成等については、後ほど図4と図5を参照しながら説明を行う。
また、ドキュメント処理装置104にはデータ記憶装置110が通信可能に接続されている。データ記憶装置110は、例えば、ハードディスク・ドライブ、その他の磁気記憶装置、光学式記憶装置、フラッシュ・メモリまたはそれらの任意の組み合わせを含む、本技術分野で知られている大容量記憶装置である。一実施形態においては、データ記憶装置110は、ドキュメント処理装置104によって実行可能な、例えば音声認識ソフトウェア、およびグラフィカル・ユーザ・インターフェイスのソフトウェア等の類の適切なソフトウェア・アプリケーションとともに、ドキュメント・データ、画像データ、または電子データベースのデータ等を保存するように適切に適合されている。データ記憶装置110は、図1Aにおいてはシステム100の独立したコンポーネントとして例示されているが、例えば、内蔵ハードディスク・ドライブ等のような、ドキュメント処理装置104の内部記憶装置、あるいはコントローラ108のコンポーネント等として実装することができる。
システム100は、さらに、通信リンク124を介したコンピュータ・ネットワーク102にわたる複数の装置とドキュメントの、アクセス、保存、および管理を容易にするように機能するドキュメント管理システム・サーバ120を含む。本発明による一実施形態において、通信リンク124は、コンピュータ・ネットワーク102を介した情報の送受信を、セキュリティ面で安全に行うことができる。適切な通信リンク124としては、例えば、IEEE802.11a、IEEE802.11b、IEEE802.11g、IEEE802.11(x)、Bluetooth(登録商標)、WiMax、赤外線接続、光接続、専用通信ネットワーク、公衆交換電話網、または、本技術分野において知られている他の適切な有線または無線のデータ通信チャネルがある。
好ましくは、ドキュメント管理システム・サーバ120は、例えば、ドキュメント・ルーティング要求、ドキュメント出力要求、ドキュメント保存要求、および電子メール通信等を含む、コンピュータ・ネットワーク102を介して受信される多様な要求を、受信し、処理するように適合されている。さらにドキュメント管理システム・サーバ120は、複数の装置、例えば、コンピュータ・ワークステーション、スマートフォン、携帯情報端末(PDA)、ドキュメント処理装置、ファクシミリ装置、またはプリンタ等に、コンピュータ・ネットワーク102を介して、ドキュメント・データを伝達することができる。
また、ドキュメント管理システム・サーバ120には、データ記憶装置122が通信可能に接続されている。データ記憶装置122は、例えば、ハードディスク・ドライブ、その他の磁気記憶装置、光学式記憶装置、フラッシュ・メモリまたはそれらの任意の組み合わせを含む本技術分野で知られている大容量記憶装置である。一実施形態においては、データ記憶装置122は、ドキュメント・データ、画像データ、電子データベースのデータ、またはアプリケーション・プログラム等を保存するように適切に適合されている。データ記憶装置122は、図においてはシステム100の独立したコンポーネントとして例示されているが、例えば、内蔵ハードディスク・ドライブ等のような、ドキュメント管理システム・サーバの内部記憶コンポーネントとして実装することができる。ドキュメント管理システム・サーバ120およびデータ記憶装置122は、複数の電子ドキュメントおよびユーザ・アカウント等の、作成、保存、管理および処理を可能にするドキュメント管理システムとして機能する。
システム100は、さらに、通信リンク128を介して、コンピュータ・ネットワーク102とのデータ通信を行うユーザ装置126を含む。図においてはユーザ装置126をデスクトップ形パーソナル・コンピュータとして示しているが、これは例示にすぎない。ユーザ装置126は、例えば、コンピュータ・ワークステーション、ノート形パーソナル・コンピュータ、携帯情報端末、ウェブ対応携帯電話、スマートフォン、専用通信ネットワーク用の電子装置、またはその他のウェブ対応の電子装置を含む、本技術分野において知られている任意のパーソナル・コンピューティング装置を表している。通信リンク128は、例えば、Bluetooth(登録商標)、WiMax、IEEE802.11a、IEEE802.11b、IEEE802.11g、IEEE802.11(x)、専用通信ネットワーク、赤外線接続、光接続、公衆交換電話網、または本技術分野において知られている他の適切な有線または無線のデータ通信チャネルである。ユーザ装置126は、電子ドキュメント、ドキュメント処理インストラクション、ユーザ・インターフェイスの修正、アップグレード、更新、またはパーソナル化データ等を生成し、ドキュメント処理装置104またはその他の任意のコンピュータ・ネットワーク102に接続されている類似の装置に送信するか、または、ドキュメント処理装置104、ドキュメント管理システム・サーバ120、またはその他の任意のコンピュータ・ネットワーク102に接続されている類似の装置から電子ドキュメント・データを受信するように適合されている。
次に、図2および図3を参照しながら、本発明による実施形態におけるシステムの動作が実行されるドキュメント処理装置のハードウェアおよび機能構成等を説明する。図2に本発明による実施形態においてシステム100の動作が実行されるドキュメント処理装置200(図1Aにおいては装置104として表されている。)のハードウェア・アーキテクチャの構成例を示す。ドキュメント処理装置200には、少なくとも一つのCPUから構成されるプロセッサ202が含まれている。プロセッサ202は、互いに協調して動作する複数のCPUから構成されることもある。また、ドキュメント処理装置200には、BIOS機能、システム機能、システム構成データおよびドキュメント処理装置200の動作に使用するその他のルーチンもしくはデータ等の静的または固定的なデータ、あるいはインストラクションのために有効に使用される、不揮発性または読出し専用メモリ(ROM)204が含まれている。
また、ドキュメント処理装置200には、ダイナミック・ランダム・アクセス・メモリ、スタティック・ランダム・アクセス・メモリ、または他の任意の適切なアドレス指定可能かつ書込み可能なメモリ・システムから構成されるRAM206が含まれている。RAM206は、プロセッサ202によって処理されるアプリケーションおよびデータ処理に関係するデータ・インストラクションのための記憶領域を提供する。
ストレージ・インターフェイス208は、ドキュメント処理装置200に関連するデータの不揮発性保存、大容量保存または長期的な保存ためのメカニズムを提供する。ストレージ・インターフェイス208は、引用符号216として図示したディスク・ドライブ、あるいは光学式ドライブ、テープ・ドライブ等の適切な任意のアドレス指定可能、またはシリアル記憶装置等の大容量記憶装置の他、当業者に知られている適切な任意の記憶媒体を使用する。
ネットワーク・インターフェイス・サブシステム210は、ネットワークとの間の入出力を適切にルーティングすることによって、ドキュメント処理装置200が他の装置と通信することを可能にする。ネットワーク・インターフェイス・サブシステム210は、ドキュメント処理装置200の外部装置との一つまたは複数のコネクションを確立する。図においては、一例として、Ethernet(登録商標)およびトークン・リング等といった固定または有線ネットワークとのデータ通信のための少なくとも一つのネットワーク・インターフェイス・カード214、およびWiFi(Wireless Fidelity)、WiMax、無線モデム、セルラ・ネットワークまたは適切な任意の無線通信システム等の手段を介した無線通信のために適切な無線インターフェイス218を示している。ネットワーク・インターフェイス・サブシステム210は、任意の物理的データ転送レイヤあるいは物理的データ転送レイヤではないデータ転送レイヤまたはプロトコル・レイヤを適切に利用する。図においては、ネットワーク・インターフェイス・カード214は、例えば、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワークまたはそれらの組合せから適切に構成される物理的ネットワーク220を介したデータ交換を行うために、相互接続されている。
プロセッサ202、読出し専用メモリ(ROM)204、RAM206、ストレージ・インターフェイス208およびネットワーク・インターフェイス・サブシステム210の間のデータ通信は、バス212によって例示したバス・データ転送メカニズムを介して行われる。
ドキュメント処理装置200における実行可能なインストラクションは、ワークステーション、他のドキュメント処理装置、サーバ等の複数の外部装置との通信を円滑に実行する。動作の際、代表的な装置は自立的に動作するが、しばしば、ローカル・ユーザによる直接的な制御が望ましい場合もある。ローカル・ユーザによる直接的な制御は、ユーザ入出力(I/O)パネル224へのオプションの入出力(I/O)インターフェイス222を介して実行することができる。
また、1つまたは複数のドキュメント処理エンジンへのインターフェイスも、バス212を介してデータ通信を行う。図に示した実施形態においては、印刷インターフェイス226、コピー・インターフェイス228、画像走査インターフェイス230およびファクシミリ・インターフェイス232は、それぞれ、印刷エンジン234、コピー・エンジン236、画像走査エンジン(スキャナ)238、およびファクシミリ・エンジン240との通信を容易にする。ドキュメント処理装置200は、1つまたは複数のドキュメント処理機能を適切に実行する。複数のドキュメント処理動作を実行するシステムは、前述したように一般に、多機能周辺装置(MFP)または多機能装置と呼ばれる。
次に図3を参照しながらシステムの動作が実行される、図1Aにおいてはドキュメント処理装置104として示した適切なドキュメント処理装置の機能ブロックを説明する。図3に、本発明による実施形態のシステム100の動作が実行されるドキュメント処理装置300の機能ブロックの構成例を示す。図3は、ソフトウェアおよびオペレーティング・システム機能と関連して、図2に示したハードウェアの機能性を例示している。
ドキュメント処理装置300は、1つまたは複数のドキュメント処理動作を円滑に実行するドキュメント処理エンジン302を含んでいる。ドキュメント処理エンジン302は、印刷エンジン304、ファクシミリ・エンジン306、画像走査エンジン(スキャナ)308およびコンソール・パネル310を含む。印刷エンジン304は、ドキュメント処理装置300に伝達された電子ドキュメントを表す物理的なドキュメント、すなわちハードコピーの出力を可能とする。ファクシミリ・エンジン306は、ファクシミリ・モデム等の装置を介して、外部のファクシミリ装置との間で相互にファクシミリ通信を行う。
画像走査エンジン(スキャナ)308は、ハードコピー・ドキュメントを受け取り、このハードコピー・ドキュメントに対応する画像データに変換するように機能する。コンソール・パネル310等のユーザ・インターフェイスは、ユーザからのインストラクションの入力と、ユーザへの情報の表示を可能にする。画像走査エンジン308は、目に見える有形のドキュメントの入力を、ビットマップ・フォーマット、ベクター・フォーマットまたはページ記述言語(PDL)フォーマットの電子的な形態へ変換し、さらに、光学文字認識のためにも構成されている。また、実際の目に見える有形のドキュメントの画像走査は、ファクシミリ動作においても有効に機能する。
図に示したドキュメント処理エンジン302は、ドライバ326を介したネットワークとのインターフェイス316も備え、例えばネットワーク・インターフェイス・カードから構成されている。ネットワークは、有線、無線あるいは光によるデータ通信のような任意の適切な物理的レイヤおよび物理的でないレイヤによって、十分なやり取りを実現している。
ドキュメント処理エンジン302は、1つまたは複数のデバイス・ドライバ314と適切な通信を行う。デバイス・ドライバ314は、実際のドキュメント処理動作を実行するために、ドキュメント処理エンジン302と、1つまたは複数の物理的装置との間のデータの相互交換を可能とする。このようなドキュメント処理動作には、ドライバ318による印刷、ドライバ320によるファクシミリ通信、ドライバ322による画像走査、およびドライバ324によるユーザ・インターフェイス機能の中の1つまたは複数のものが含まれる。これらの多様な装置は、ドキュメント処理エンジン302と関連する1つまたは複数の対応したエンジンと結合されている。本発明においては、ドキュメント処理動作の任意のセットまたはサブセットが想定されている。複数の利用可能なドキュメント処理選択肢を含むドキュメント処理装置はMFPと呼ばれている。
次に、図4および図5を参照しながら、本発明による実施形態におけるシステムの動作が実行されるコントローラのハードウェアおよび機能構成等を説明する。図4に本発明による実施形態においてシステム100の動作が実行されるバックエンド・コンポーネント、すなわち、図1Aにおいてはコントローラ108として示したコントローラ400のハードウェア・アーキテクチャの構成例を説明するための図を示す。尚、図においては、コントローラの構成要素の意義をより明確にするため、参照符号432で表した、コントローラ以外のドキュメント処理装置の構成要素の一部を併せて示している。コントローラ108は、本明細書に記載する動作を円滑に実行する能力を有する、本技術分野において知られている任意の汎用コンピューティング装置を表している。コントローラ400には、少なくとも一つのCPUを含むプロセッサ402が含まれている。プロセッサ402は、互いに協調して動作する複数のCPUから構成されることもある。また、コントローラ400には、BIOS機能、システム機能、システム構成データおよびコントローラ400の動作に使用されるその他のルーチンもしくはデータ等の静的または固定的なデータ、あるいはインストラクションのために有効に使用される、不揮発性または読出し専用メモリ(ROM)404が含まれている。
また、コントローラ400には、ダイナミック・ランダム・アクセス・メモリ、スタティック・ランダム・アクセス・メモリ、または他の任意の適切なアドレス指定可能かつ書込み可能なメモリ・システムから構成されるRAM406が含まれている。RAM406は、プロセッサ402によって処理されるデータ処理およびアプリケーションに関係するデータ・インストラクションのための記憶領域を提供する。
ストレージ・インターフェイス408は、コントローラ400に関連するデータの不揮発性保存、大容量保存または長期的な保存ためのメカニズムを提供する。ストレージ・インターフェイス408は、引用符号416で示したディスク・ドライブ、あるいは光学式ドライブ、テープ・ドライブ等の適切な任意のアドレス指定可能、またはシリアル記憶装置等の大量記憶装置の他、当業者に知られている適切な任意の記憶媒体を使用する。
ネットワーク・インターフェイス・サブシステム410は、ネットワークとの間の入出力を適切にルーティングすることによって、コントローラ400が他の装置と通信することを可能にする。ネットワーク・インターフェイス・サブシステム410は、装置400に対する外部装置との一つまたは複数のコネクションのインターフェイスを適切にとる。図においては、例えば、Ethernet(登録商標)およびトークン・リング等といった固定または有線ネットワークとのデータ通信のための少なくとも一つのネットワーク・インターフェイス・カード414、およびWiFi、WiMax、無線モデム、セルラ・ネットワークまたは適切な任意の無線通信システム等の手段を介した無線通信のために適切な無線インターフェイス418とを示している。ネットワーク・インターフェイス・サブシステム410は、任意の物理的データ転送レイヤあるいは物理的データ転送レイヤではないデータ転送レイヤまたはプロトコル・レイヤを適切に利用する。図においては、ネットワーク・インターフェイス・カード414は、例えば、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワークまたはそれらの組合せから適切に構成される物理的ネットワーク420を介したデータ交換を行うために、相互接続されている。
プロセッサ402、読出し専用メモリ(ROM)404、RAM406、ストレージ・インターフェイス408およびネットワーク・インターフェイス・サブシステム410の間のデータ通信は、バス412によって例示したバス・データ転送メカニズムを介して行われる。
また、ドキュメント・プロセッサ・インターフェイス422もバス412を介してデータ通信を行う。ドキュメント・プロセッサ・インターフェイス422は、様々なドキュメント処理動作を実行するために、ドキュメント処理ハードウェア432との接続を提供する。そのようなドキュメント処理動作には、コピー・ハードウェア424によって実行されるコピー、画像走査ハードウェア426によって実行される画像走査、印刷ハードウェア428によって実行される印刷、およびファクシミリ・ハードウェア430によって実行されるファクシミリ通信がある。コントローラ400は、これらのドキュメント処理動作のいずれかまたは全部を適切に動作させる。複数のドキュメント処理動作を実行可能なシステムは、前述したように、MFPまたは多機能装置と呼ばれる。システム100の機能は、ドキュメント処理装置と関連するインテリジェント・サブシステムとして図4に示したコントローラ400(図1Aにおいてはコントローラ108として示されている。)を含む、ドキュメント処理装置104において実行される。
次に図5を参照しながらシステムの動作が実行されるコントローラの機能ブロックと動作の概要を説明する。図5に、本発明による実施形態のシステム100の動作が実行されるコントローラの機能ブロックの構成例を説明するための図を示す。尚、図5においても、コントローラの機能要素の意義をより明確にするため、コントローラ以外のドキュメント処理装置の機能要素の一部を併せて示している。図5は、ソフトウェアおよびオペレーティング・システム機能と関連して、図4に示したハードウェアの機能性を例示している。
コントローラの機能は、ドキュメント処理エンジン502を含む。一実施形態において、ドキュメント処理エンジン502は、印刷動作、コピー動作、ファクシミリ通信動作および画像走査動作を可能にする。これらの機能が一つの装置で実行できる装置は、産業界において一般に好まれているドキュメント処理周辺装置であるMFPである。しかし、コントローラが上記のドキュメント処理動作のすべてを可能にする必要は必ずしもない。コントローラは、上記のドキュメント処理動作の一部を実行する専用のドキュメント処理装置、あるいはより限定した目的のドキュメント処理装置においても有効に用いられる。
ドキュメント処理エンジン502はユーザ・インターフェイス・パネル510と適切にインターフェイスされている。ユーザまたは管理者は、このユーザ・インターフェイス・パネル510を介して、ドキュメント処理エンジン502によって制御される機能にアクセスすることができる。アクセスは、コントローラにローカル接続されているインターフェイスを介して行われるか、または遠隔のシン・クライアント(thin client)もしくはシック・クライアント(thick client)によって遠隔から行われる。
ドキュメント処理エンジン502は、印刷機能部504、ファクシミリ通信機能部506および画像走査機能部508とデータ通信を行う。これらの機能部は、印刷、ファクシミリの送受信、およびドキュメント画像をコピーのために取得するか、またはドキュメント画像の電子バージョンを生成するための、ドキュメント画像走査の実際の処理動作を容易にする。
ジョブ・キュー(job queue)512は、印刷機能部504、ファクシミリ通信機能部506および画像走査機能部508とデータ通信を行う。ビットマップ・フォーマット、ページ記述言語(PDL)フォーマットまたはベクター・フォーマット等の種々の画像形式は、画像走査機能部508からジョブ・キュー512を介して以降の処理のために中継される。
ジョブ・キュー512は、また、ネットワーク・サービス機能部514ともデータ通信を行う。一実施形態において、ジョブ制御、状態データまたは電子ドキュメント・データが、ジョブ・キュー512とネットワーク・サービス機能部514との間で交換される。このように、任意の適切なシン・クライアントまたはシック・クライアントとなるクライアント側ネットワーク・サービス機能520を介したコントローラへのネットワーク・ベースのアクセスのために、適切なインターフェイスが設けられている。一実施形態において、ウェブ・サービス・アクセスは、ハイパーテキスト転送プロトコル(HTTP)、ファイル転送プロトコル(FTP)、ユニフォーム・データ・ダイアグラム・プロトコルまたは他の任意の適切な交換メカニズムによって実行される。ネットワーク・サービス機能部514は、また、FTP、電子メール、テルネット(TELNET)等による通信のために、クライアント側ネットワーク・サービス機能520とのデータ交換も有効に提供する。このように、コントローラ機能は、種々のネットワーク・アクセス・メカニズムによって、電子ドキュメントおよびユーザ情報の出力あるいは受信を容易にする。
ジョブ・キュー512は、また、画像プロセッサ516ともデータ通信を行う。画像プロセッサ516は、印刷機能部504、ファクシミリ通信機能部506または画像走査機能部508等の装置機能部と、電子ドキュメントを交換するために適したフォーマットに変換するラスタ画像処理(RIP)、ページ記述言語インタープリタまたは任意の適切な画像処理を行うメカニズムである。
最後に、ジョブ・キュー512は、ジョブ解析部(job parser)518とデータ通信を行い、このジョブ解析部518はクライアント装置サービス部522等の外部装置からの印刷ジョブ言語ファイルを受け取る働きをする。クライアント装置サービス部522は、電子ドキュメントの印刷、ファクシミリ通信、またはコントローラ機能による処理が有効である他の適切な電子ドキュメントの入力を含む。ジョブ解析部518は、受け取った電子ドキュメント・ファイルを解析し、前述した機能およびコンポーネントと関連する処理のために、解析した電子ドキュメント・ファイル情報をジョブ・キュー512に中継する働きをする。
以下、本発明における動作の概要を説明する。先ず、ユーザ・インターフェイス106のディスプレイ112に第1のレベルのグラフィック画像が表示される。第1のレベルのグラフィック画像のそれぞれは、ドキュメント処理装置104によって実行可能であって利用可能な第1のレベルのドキュメント処理動作を一意的に表す。次に、ユーザによって選択された第1のレベルのドキュメント処理動作に対応する第1の可聴音声情報が、ユーザから受け取られる。次に、選択された第1のレベルのドキュメント処理動作が、受け取られた第1の可聴音声情報にしたがって、特定される。次いで、第2のレベルのグラフィック画像がディスプレイ112に表示される。表示される第2のレベルのグラフィック画像のそれぞれは、選択された第1のレベルのドキュメント処理動作に対応する第2のレベルのドキュメント処理動作を一意的に表す。その後、ユーザによって選択された第2のレベルのドキュメント処理動作の1つに対応する第2の可聴音声情報が、ユーザから受け取られる。次に、利用可能な第2のレベルのドキュメント処理動作から選択された処理動作が、受け取られた第2の可聴音声情報にしたがって、特定される。次いで、ドキュメント処理動作が、選択された第1のレベルのドキュメント処理動作および選択された第2のレベルのドキュメント処理動作にしたがって、ドキュメント処理装置104において開始される。
ここで、選択された第1のレベルのドキュメント処理動作に対応する第2のレベルのドキュメント処理動作が存在しない場合等、ドキュメント処理装置104において1のレベルのドキュメント処理動作のみを実行すれば良い場合もある。このような実施形態においては、先ず、ユーザ・インターフェイス106のディスプレイ112に第1のレベルのグラフィック画像が表示される。第1のレベルのグラフィック画像のそれぞれは、ドキュメント処理装置104によって実行可能であって利用可能な第1のレベルのドキュメント処理動作を一意的に表す。次に、ユーザによって選択された第1のレベルのドキュメント処理動作に対応する第1の可聴音声情報が、ユーザから受け取られる。次に、選択された第1のレベルのドキュメント処理動作が、受け取られた第1の可聴音声情報にしたがって、特定される。次いで、ドキュメント処理動作が、選択された第1のレベルのドキュメント処理動作にしたがって、ドキュメント処理装置104において開始される。
本発明による一実施形態において、適切な第1のレベルのドキュメント処理動作としては、例えば、コピー、印刷、ファクシミリ送信、電子メール送信、画像走査および保存等がある。さらに、本発明による一実施形態において、第2のレベルのドキュメント処理動作としては、例えば、ステープル、孔開け(パンチ)、丁合い、用紙サイズの選択、ページの向き、ページ設定、出力パレットの選択、出力先、解像度および料金の会計(accounting charges)等がある。
本発明の例示的な一実施形態によれば、先ず、第1のレベルのグラフィック画像がドキュメント処理装置104のユーザ・インターフェイス106のディスプレイ112に表示される。第1のレベルのグラフィック画像のそれぞれは、例えば、ドキュメント処理装置104によって実行可能な第1のレベルのドキュメント処理動作に関連付けされたアイコンである。ドキュメント処理装置104によって実行可能な、適切な第1のレベルのドキュメント処理動作としては、例えば、コピー、印刷、ファクシミリ送信、電子メール送信、画像走査および保存等がある。次いで、ユーザは、所望の第1のレベルのドキュメント処理動作を表す用語を発声するか、アイコンに触れる。このようなユーザ選択情報は、マイクロフォン116、タッチ・スクリーン・ディスプレイ112、またはユーザ・インターフェイス106のその他のユーザ入力デバイスを介して、ドキュメント処理装置104によって受け取られる。例えば、ディスプレイ112、スピーカ114による音声出力およびマイクロフォン116による音声入力、ディスプレイ制御および音声制御コンポーネントの間の通信を可能にする共通コンポーネント等を制御することができるソフトウェア・コンポーネントを採用しているコントローラ108が、選択された第1のレベルのドキュメント処理動作のユーザ選択入力を、ユーザ・インターフェイス106を介して受け取る。
本発明による特定の一実施形態において、ユーザは、ユーザ装置126を介し、適切なウェブ・ブラウザ・インターフェイスを使用してコンピュータ・ネットワーク102経由で、ドキュメント処理動作の実行を要求することができる。このような実施形態においては、ユーザ装置126に関連付けされたユーザ・インターフェイスが、ユーザ選択の受取りおよびユーザに対する操作画像の表示を容易にする。
次に、コントローラ108、またはドキュメント処理装置104に関連付けされたその他の適切なコンポーネントは、受け取った第1のレベルのドキュメント処理動作の選択を表すユーザ入力が、音声入力のような可聴入力であるか否か、すなわちユーザによって第1のレベルのドキュメント処理動作に関連付けされた用語が発声されたか否かを、判断する。コントローラ108が、可聴入力が受け取られたと判断した場合には、選択された第1のレベルの動作が可聴入力から判定される。コントローラ108、またはドキュメント処理装置104のその他の適切なコンポーネントは、音声認識機能を実装して、ユーザの選択した第1のレベルのドキュメント処理動作に関する情報を検索する。本発明による一実施形態においては、ドキュメント処理装置104は、ユーザの音声を分析し、音声入力を、動作要求または特徴要求としてドキュメント処理装置104によって解釈されるデータへ変換するために、音声認識エンジンを使用する。
次に、コントローラ108は、ユーザ選択によって選択された第1のレベルのドキュメント処理動作に基づいて、そのユーザに利用可能な第2のレベルのドキュメント処理動作のタイプを決定する。ユーザに利用可能な第2のレベルのドキュメント処理動作は、選択された第1のレベルのドキュメント処理動作のタイプに依存する。すなわち、第1のレベルの印刷動作は、例えば、ステープル、孔開け、および丁合い等の第2のレベルのドキュメント処理動作を含むが、第1のレベルの電子メール送信動作は、そのような第2のレベルのドキュメント処理動作を含まない。本発明による一実施形態において、利用可能とすることができる第2のレベルのドキュメント処理動作としては、例えば、ステープル、孔開け、丁合い、用紙サイズの選択、ページの向き、ページ設定、出力パレットの選択、出力先、解像度および料金の会計等がある。
選択された第1のレベルの動作に基づいて利用可能な第2のレベルのドキュメント処理動作が決定されると、ユーザ・インターフェイス106を介し、コントローラ108によってディスプレイ112上に第2のレベルの画像が表示される。これらの第2のレベルの画像のそれぞれは、利用可能な第2のレベルのドキュメント処理動作のうちの1つを一意的に表し、例えば、それぞれの第2のレベルの動作に関連付けされた一意的なアイコンが選択のためにユーザに表示される。次に、例えばタッチ・スクリーンのディスプレイ112、マイクロフォン116、ユーザ・インターフェイス106に関連付けされたその他の入力ハードウェア、またはそれらの適切な組み合わせ等のユーザ・インターフェイス106を介して、ユーザによって選択された第2のレベルのドキュメント処理動作を表す入力がコントローラ108によって受け取られる。音声入力のような可聴入力が受け取られると、マイクロフォン116を介して受け取られた音声情報から、ユーザによって選択された第2のレベルのドキュメント処理動作が特定され、ユーザ所望の第2のレベルのドキュメント処理動作が決定される。選択された第2のレベルのドキュメント処理動作は、次に、可聴入力または非可聴入力によって受け取られたか否かによらず、そのユーザによって選択された第1のレベル、第2のレベル、およびその後に続く任意のレベルのドキュメント処理動作を表すワークフロー・データに、追加される。ここで、ワークフロー・データは、所定のドキュメント処理要求のために実行される選択されたドキュメント処理動作のセット、すなわち、結果として、処理済みドキュメントの出力を生成するドキュメント処理装置104によって実行される一連の動作を表す。
次に、ディスプレイ112によってユーザに表示される第2のレベルのドキュメント処理動作を表す画像は、ユーザによって選択された第2のレベルのドキュメント処理動作を反映するように更新、例えば、修正される。続いて、ユーザは、表示された第2のレベルのドキュメント処理動作の画像から追加の第2のレベルのドキュメント処理動作を選択することが可能であり、その選択結果はワークフロー・データに追加される。第2のレベルのドキュメント処理動作のそれぞれの選択によって、ユーザによって行われた選択を反映するようにディスプレイ112の表示が更新される。
すべてのユーザ選択が行われると、例えば、すべての所望の第2のレベルのドキュメント処理動作が選択されると、コントローラ108が、ドキュメント処理装置104によるワークフローの実行に対して料金を課すべきか否か、すなわち有料か否かを判断する。本発明による一実施形態においては、ユーザは、ドキュメント処理サービスの実行に対して課金される。このように、料金が課せられる場合には、要求されたドキュメント処理動作の実行に関連するコストが生成され、ユーザ・インターフェイス106のディスプレイ112を介してユーザに表示される。ドキュメント処理要求がユーザ装置126から出された場合には、ドキュメント処理装置104によるドキュメント処理動作の実行のために計算された料金は、ユーザ装置126に伝達され、ユーザ装置126でユーザに料金が表示される。料金が課せられない場合には、ドキュメント処理装置104は、選択された第1のレベルのドキュメント処理動作および選択された関連する第2のレベルのドキュメント処理動作を含む、ワークフロー・データによって示されるとおりに、選択されたドキュメント処理動作の実行を開始する。
料金が課せられる場合には、ドキュメント処理装置104は、ユーザによる支払方法の選択を待つ。例えば、ドキュメント処理装置104は、ユーザが適切な支払データを入力するまで待つ。次に、プリペイド・アカウント番号、クレジット・カード・アカウント番号または請求書アカウント情報等を表すアカウント・データのユーザ入力が、コントローラ108によって受け取られる。本発明によるこの例の実施形態においては、アカウント・データは、例えばディスプレイ112またはユーザ・インターフェイス106のその他の入力デバイスを介してマニュアルで入力されたデータのような非可聴データ入力、または、例えばマイクロフォン116を介した音声情報のような可聴入力データとして、受け取られることができる。アカウント・データが受け取られると、コントローラ108は、例えば、ユーザによって、または支払許可システム(例えば、ドキュメント管理システム・サーバ120)への確認等によって、その料金が認められたか否かを判断する。料金が認められた場合には、ドキュメント処理装置104は、選択された第1および第2のレベルのドキュメント処理動作の実行を開始する。料金が認められなかった場合、ユーザは、代わりの支払方法を入力するか、またはドキュメント処理要求を終了することができる。
以上、図1ないし図5を参照しながら説明を行ったシステム100およびそのコンポーネントの動作は、図6および図7を参照しながら以下に行う、本発明による実施形態におけるドキュメント処理装置のオーディオビジュアル制御の動作説明によって、理解が深まるであろう。図6に、本発明による実施形態におけるドキュメント処理装置のオーディオビジュアル制御の基本的な動作例を表すフローチャートを示す。先ず、S602で、それぞれが一意的に利用可能な複数の第1のレベルのドキュメント処理動作の1つを表す第1のレベルのグラフィック画像が、ディスプレイ上に表示される。適切な第1のレベルのドキュメント処理動作としては、例えば、コピー、印刷、ファクシミリ送信、電子メール送信、画像走査、および保存等がある。次にS604において、利用可能な第1のレベルのドキュメント処理動作のうちから選択された1つに対応する第1の可聴音声情報が、ユーザから受け取られる。
次いでS606において、選択された第1のレベルのドキュメント処理動作が、第1の可聴音声情報にしたがって特定される。本発明による一実施形態においては、ドキュメント処理装置104に関連付けされた音声認識コンポーネントが、受け取られた可聴音声情報を分析し、選択された第1のレベルのドキュメント処理動作を示す適切なデータを生成する。次にS608で、選択された第1のレベルのドキュメント処理動作に基づいて、第2のレベルのドキュメント処理動作を表すグラフィック画像がディスプレイ112上に表示される。それぞれの第2のレベルのグラフィック画像は、選択された第1のレベルのドキュメント処理動作に対応する第2のレベルのドキュメント処理機能を一意的に表す。第2のレベルのドキュメント処理動作のタイプは、ユーザによって選択された第1のレベルのドキュメント処理動作のタイプにしたがって異なる。したがって、印刷動作のために利用可能な第2のレベルのドキュメント処理動作が、必ずしも電子メール送信動作のために利用可能である必要はない。ユーザによって選択された第1のレベルのドキュメント処理動作が印刷動作であるとき、適切な第2のレベルのドキュメント処理動作としては、例えば、ステープル、孔開け、丁合い、用紙サイズの選択、ページの向き、ページ設定、出力パレットの選択、出力先、解像度および料金の会計等がある。
S610においては、利用可能な第2のレベルのドキュメント処理動作から選択された1つの第2のレベルのドキュメント処理動作に対応する第2の可聴音声情報が、ユーザから受け取られる。次に、受け取られた第2の可聴音声情報から、S612において、選択された第2のレベルのドキュメント処理動作が特定され、選択された第2のレベルのドキュメント処理動作が突きとめられる。その後、特定された第1のレベルの選択されたドキュメント処理動作、および特定された第2のレベルの選択されたドキュメント処理動作にしたがって、S614で、所望のドキュメント処理動作がドキュメント処理装置104によって開始される。
前述したように、選択された第1のレベルのドキュメント処理動作に対応する第2のレベルのドキュメント処理動作が存在しない場合等、ドキュメント処理装置104において1のレベルのドキュメント処理動作のみを実行すれば良い場合もある。このような実施形態においては、S608以降の動作が図6に示した動作と異なる。すなわち、S606において、選択された第1のレベルのドキュメント処理動作が、第1の可聴音声情報にしたがって特定されると、第1のレベルのドキュメント処理動作に対応する第2のレベルのドキュメント処理動作の特定は不要であるため、S608ないしS612の処理はスキップされ、S606で特定された第1のレベルのドキュメント処理動作のみにしたがって、所望のドキュメント処理動作がドキュメント処理装置104によって開始される。
次に図7を参照しながら、本発明による実施形態におけるドキュメント処理装置のオーディオビジュアル制御の動作をさらに詳細に説明する。図7に、本発明による実施形態におけるドキュメント処理装置のオーディオビジュアル制御の動作例をさらに詳細に表したフローチャートを示す。先ずS702において、第1のレベルのドキュメント処理動作に対応する画像またはアイコンがディスプレイ112に表示される。ここで、それぞれのアイコンはドキュメント処理装置104によって実行可能な第1のレベルのドキュメント処理動作に対応する。本発明による一実施形態において、適切な第1のレベルのドキュメント処理動作としては、例えば、印刷動作、画像走査動作、保存動作、ファクシミリ送信、電子メール送信およびコピー動作等がある。これまでの説明は、ユーザがドキュメント処理装置104の傍らにいる場合を想定しているが、ユーザは、例えばユーザ装置126またはその類の装置から、ドキュメント処理動作を遠隔から要求することができる。このような実施形態においては、コマンド、表示、インストラクションおよびコスト等のデータが、コンピュータ・ネットワーク102を介して、ユーザ装置126とドキュメント処理装置104の間の通信によって、やり取りされる。
次にS704において、第1のレベルのドキュメント処理動作を表すアイコンの1つの選択を表すユーザ入力が受け取られる。次いでS706においては、そのユーザ入力が、例えばユーザによる音声入力情報の類の可聴入力であったか否か、または、例えばタッチ・スクリーン・ディスプレイ112、英数字キーパッド、または専用ハードウェア・ボタン等のユーザ・インターフェイス106と、ユーザとの間の物理的なやり取りの類の非可聴入力であったか否かについての判断が行われる。ユーザ入力が可聴入力であると判断されると、処理はS708に進み、ユーザによって選択された第1のレベルのドキュメント処理動作が、そのユーザから受け取られた音声情報にしたがって特定される。一実施形態において、ドキュメント処理装置104は音声認識コンポーネントを備えており、マイクロフォン114を介して受け取られた音声入力の受信および処理を行い、この音声入力を、コントローラ108による後に続く処理に適したフォーマットに変換する。次に処理はS710に進み、受け取られた第1のレベルのドキュメント処理動作の選択にしたがって利用可能な第2のレベルのドキュメント処理動作が決定される。
同様に、ドキュメント処理装置104によって非可聴ユーザ入力が受け取られたと判断された場合には、処理はS706からS710に進む。すなわち、ユーザが、例えばタッチ・スクリーン、ハードウェア・ボタン等の非可聴手段を使用して第1のレベルのドキュメント処理動作を選択したときには、処理はS706からS710に進む。ユーザによって選択された第1のレベルのドキュメント処理動作が決定されると、S710において、第1のレベルの動作に関連付けされた対応する第2のレベルのドキュメント処理動作が決定される。適切な第2のレベルのドキュメント処理動作としては、例えば、ステープル、孔開け、丁合い、用紙サイズの選択、ページの向き、ページ設定、出力パレットの選択、出力先、解像度および料金の会計等がある。ここで、1つの第1のレベルのドキュメント処理動作に利用可能な第2のレベルのドキュメント処理動作が、異なる第1のレベルのドキュメント処理動作に利用可能でない場合がある。例えば、コピーおよび印刷といった第1のレベルのドキュメント処理動作は、ステープル、または孔開け等の第2のレベルのドキュメント処理動作を含むことが可能である。しかし、電子メール送信または保存動作といった第1のレベルのドキュメント処理動作は、これらの動作からの出力がステープル、または孔開け等の第2のレベルのドキュメント処理動作を組み込むことが不可能であるため、これらの機能を含むことがない。
次にS712において、利用可能な第2のレベルのドキュメント処理動作に対応する第2のレベルの画像がディスプレイ112上に表示される。表示されるそれぞれの画像またはアイコンは、第1のレベルのドキュメント処理動作に関連付けされた特定の第2のレベルのドキュメント処理動作と一意的に対応する。次いでS714において、ユーザ所望の第2のレベルのドキュメント処理動作を表すユーザ入力が受け取られる。次にS716において、ユーザ入力が可聴または非可聴の入力であるか否かについての判断が行われる。可聴入力が受け取られたと判断された場合には、処理はS718に進み、可聴入力から第2のレベルのドキュメント処理動作が特定され、利用可能な第2のレベルの動作のいずれがユーザによって選択されたかが特定される。非可聴入力が受け取られたと判断された場合には、処理はS720に進み、選択された第2のレベルのドキュメント処理動作が、すべての既に選択されたドキュメント処理動作を表すワークフロー・データに追加される。ここで、S720における処理は、可聴入力または非可聴の入力のいずれがユーザから受け取られたかに関わらず、実行される。選択された第2のレベルのドキュメント処理動作をワークフロー・データに追加された後、S722において第2のレベルのドキュメント処理動作を表す画像のディスプレイ112が、選択された第2のレベルのドキュメント処理動作が示されるように更新される。ディスプレイ112を更新するに際しては、例えばハイライト表示、アンダーライン付け、太字、影付き、または削除等を含み、対応するアイコンの変更等の任意の方法を用いることができる。
次にS724において、ユーザがさらなる第2のレベルのドキュメント処理動作を追加することを要求しているか否かが判断される。例えば、第1のレベルのドキュメント処理動作が印刷動作である場合には、ユーザが、第2のレベルのドキュメント処理動作としてステープルおよび孔開けの追加を希望する可能性がある。追加の第2のレベルのドキュメント処理動作が要求されているときには、処理はS714に戻り、追加の第2のレベルのドキュメント処理動作に対応するユーザ入力が受け取られる。その後は、S714〜S724に関して前述した処理動作が続く。追加の第2のレベルのドキュメント処理動作が要求されていないときには、処理はS726に進み、要求されたドキュメント処理動作の実行が、ユーザによるコストの支払いを必要とするか否かが判断される。すなわち、そのドキュメント処理動作の実行のためにユーザが支払いを要求されているか否かが判断される。ユーザによる支払いが不要であると判断された場合には、処理はS728に進み、ワークフロー・データにしたがって、ドキュメント処理装置104が要求されたドキュメント処理動作の実行を開始する。
S726において料金が必要であると判断された場合には、処理はS730に進み選択されたドキュメント処理動作の実行に関連するコスト・データが計算され、ディスプレイ112を介してユーザにコスト・データを示す表示が行われる。ユーザがドキュメント処理動作を遠隔から要求した場合には、コスト・データはコンピュータ・ネットワーク102を介してユーザ装置126に伝達され、ユーザ装置126に関連するユーザ・インターフェイスによってユーザに表示される。次に、S730で計算された料金の支払いに関する支払データまたはアカウント・データに対応するユーザ入力が、S732で受け取られる。次いでS734において、そのユーザ入力が可聴入力であるか、非可聴入力であるかについての判断が行われる。すなわち、ユーザが支払データ、数値的アカウント情報、ユーザ名、または請求書情報等を、発声したか、支払データをタイプ入力したか、またはクレジット・カード、プリペイド・カード等を読取り機に通したか否かについての判断が行われる。
S734において可聴入力が受け取られたと判断されると、S736において、可聴入力から料金の会計情報に関するアカウント・データが特定される。例えば、ドキュメント処理装置に関連付けされた音声認識コンポーネントが、発声されたユーザ入力からアカウント・データを特定する。可聴入力であるかまたは非可聴入力であるかに関わらず、アカウント・データが受け取られると、処理はS738に進み、料金が認められたか否かが判断される。すなわち、支払データが有効であるか否か、ユーザが料金を認めたか否か、または料金の確認が受け取られたか否か等についての判断が行われる。当業者は認識することになろうが、前払いアカウントが使用されているときには、ドキュメント処理装置104またはその適切なコンポーネントは、例えばドキュメント管理システム・サーバ120のようなバックエンド装置に、有効性の確認のためにプリペイド・アカウント情報を伝達する。有効性が確認されるか、料金が認められたと判断されると、処理はS728に進み、ドキュメント処理装置104は、ワークフロー・データにしたがったドキュメント処理動作、すなわち選択された第1のレベルのドキュメント処理動作および選択された第2のレベルのすべてのドキュメント処理動作を開始する。S738において料金が認められなかったと判断された場合には、処理はS740に進み、要求されたドキュメント処理動作の実行は拒絶され、処理動作は終了する。
以上の説明から明らかなように、本発明によれば、ドキュメント処理装置のオーディオビジュアル制御システムおよび方法が提供される。また、本発明の一実施形態によれば、発声およびグラフィカル・ユーザ・インターフェイス入力を用いたハイブリッド形式の階層型ユーザ・インターフェイスによるドキュメント処理装置のオーディオビジュアル制御システムおよび方法が提供される。
本発明は、ソース・コード、オブジェクト・コード、部分的にコンパイルされた形のようなコード中間ソースおよびオブジェクト・コードの形、あるいは本発明の実施形態で使用するために適した任意の他の形のコンピュータ・プログラムをも含む。コンピュータ・プログラムは、スタンドアローンのアプリケーション、ソフトウェア・コンポーネント、スクリプトまたは他のアプリケーションへのプラグ・インとすることができる。本発明を実施するコンピュータ・プログラムは、例えば、ROMやRAM等の記憶媒体、CD−ROM等の光記録媒体、フロッピー(登録商標)ディスク等の磁気記録媒体等の、コンピュータ・プログラムを伝達することができる任意の実体または装置である担体上で具体化することができ、あるいは電気ケーブルまたは光ケーブルによって、または無線や他の手段によって伝えられる電気信号や光信号等の任意の担体によって伝達することができる。コンピュータ・プログラムは、サーバからインターネットを介してダウンロードすることもできる。また、コンピュータ・プログラムの機能は集積回路に組み込むこともできる。説明を行った本発明の原理を実質的にコンピュータまたはプロセッサに実行させるコードを含む任意およびすべての実施形態は、本発明の範囲内にある。
本発明の好ましい実施形態の以上の説明は、例示と説明のために行った。説明は網羅的ではなく、本発明を開示した形態に限定しようとするものでもない。以上の開示を鑑みて明らかな修正または変形が可能である。例えば、本発明による実施形態の説明に記したシステムおよび方法は、例えば、通信、汎用コンピューティング、データ処理等を含む、音声入力およびグラフィカル・ユーザ・インターフェイス入力を用いる複数の様々な電子分野に対しても適用可能であり、本発明がドキュメント処理への適用に限定されるものではない。実施形態は、本発明の原理とその実際的な応用例を最もよく示し、それにより当業者が、本発明を、意図された特定の使用に適した様々な実施形態において様々な修正で使用できるように選択され説明された。そのようなすべての修正と変形は、特許請求の範囲の記載に明示されるとおりの本発明の原理および範囲内において、当業者によって行われ得ることは明らかであり、特許請求の範囲の記載によって定められる本発明の範囲内にある。
本発明による実施形態にしたがったオーディオビジュアル・ドキュメント処理装置制御システム全体の構成例である。 本発明による実施形態オーディオビジュアル・ドキュメント処理装置制御システムに関連するユーザ・インターフェイスの拡大図である。 本発明による実施形態のシステムの動作が実行されるドキュメント処理装置のハードウェアの構成例である。 本発明による実施形態のシステムの動作が実行されるドキュメント処理装置の機能ブロックの構成例である。 本発明による実施形態のシステムの動作が実行されるコントローラのハードウェアの構成例を説明するための図である。 本発明による実施形態のシステムの動作が実行されるコントローラの機能ブロックの構成例を説明するための図である。 本発明による実施形態におけるドキュメント処理装置のオーディオビジュアル制御の基本的な動作例を表すフローチャートである。 本発明による実施形態におけるドキュメント処理装置のオーディオビジュアル制御の動作例をさらに詳細に表したフローチャートである。
符号の説明
100 システム
102 コンピュータ・ネットワーク、分散通信システム
104 ドキュメント処理装置、MFP
106 ユーザ・インターフェイス
108 コントローラ
110、122 データ記憶装置
112 ディスプレイ
114 スピーカ
116 マイクロフォン
118、124、128 通信リンク
120 ドキュメント管理システム・サーバ
126 ユーザ装置
200、300 ドキュメント処理装置
202、402 プロセッサ
204、404 読出し専用メモリ、ROM
206、406 RAM
208、408 ストレージ・インターフェイス
210、410 ネットワーク・インターフェイス・サブシステム
212、412 バス
214、316、414 ネットワーク・インターフェイス・カード
216、416 ディスク・ドライブ
218、418 無線インターフェイス
220、420 物理的ネットワーク
222 オプションの入出力インターフェイス
224 ユーザ入出力パネル
226 印刷インターフェイス
228 コピー・インターフェイス
230 画像走査インターフェイス
232 ファクシミリ・インターフェイス
234、304 印刷エンジン
236 コピー・エンジン
238、308 画像走査エンジン
240、306 ファクシミリ・エンジン
310 コンソール・パネル
314 デバイス・ドライバ
318、320、322、324、326 ドライバ
400 コントローラ
422 ドキュメント・プロセッサ・インターフェイス
424 コピー・ハードウェア
426 画像走査ハードウェア
428 印刷ハードウェア
430 ファクシミリ・ハードウェア
432 ドキュメント処理ハードウェア
502、302 ドキュメント処理エンジン
504 印刷機能部
506 ファクシミリ通信機能部
508 画像走査機能部
510 ユーザ・インターフェイス・パネル
512 ジョブ・キュー
514 ネットワーク・サービス機能部
516 画像プロセッサ
518 ジョブ解析部
520 クライアント側ネットワーク・サービス機能
522 クライアント装置サービス部

Claims (12)

  1. 可聴情報を認識し、認識された可聴情報にしたがってドキュメント処理動作を特定する認識手段と、
    それぞれが利用可能な第1のレベルのドキュメント処理動作のうちの少なくとも1つを一意的に表す複数の第1のレベルのグラフィック画像を、ディスプレイ端末上に表示する手段と、
    前記利用可能な第1のレベルのドキュメント処理動作のうちの選択された1つに対応する第1の可聴情報をユーザから受け取る手段と、
    前記認識手段に含まれ、前記受け取られた第1の可聴情報にしたがって前記利用可能な第1のレベルのドキュメント処理動作のうちの前記選択された1つのドキュメント処理動作を特定する手段と、
    それぞれが前記選択された第1のレベルのドキュメント処理動作に対応する利用可能な第2のレベルのドキュメント処理動作のうちの少なくとも1つを一意的に表す第2のレベルのグラフィック画像を、前記ディスプレイ端末上に表示する手段と、
    前記利用可能な第2のレベルのドキュメント処理動作のうちの選択された1つに対応する第2の可聴情報をユーザから受け取る手段と、
    前記認識手段に含まれ、前記受け取られた第2の可聴情報にしたがって前記利用可能な第2のレベルのドキュメント処理動作のうちの前記選択された1つのドキュメント処理動作を特定する手段と、
    前記認識手段の出力にしたがってドキュメントに対してドキュメント処理動作を開始する手段と
    を有することを特徴とするドキュメント処理装置のオーディオビジュアル制御システム。
  2. 前記選択された第1のレベルのドキュメント処理動作および前記第2のレベルのドキュメント処理動作のそれぞれに対応する非可聴ユーザ選択データを受け取る手段を、さらに、有することを特徴とする請求項1に記載のドキュメント処理装置のオーディオビジュアル制御システム。
  3. 前記開始されるそれぞれのドキュメント処理動作は、前記第1のレベルのドキュメント処理動作のみの実行を含むことを特徴とする請求項1に記載のドキュメント処理装置のオーディオビジュアル制御システム。
  4. 前記第1のレベルのドキュメント処理動作は、コピー、または印刷、またはファクシミリ送信、または電子メール送信、または画像走査、または保存処理動作を含むことを特徴とする請求項1に記載のドキュメント処理装置のオーディオビジュアル制御システム。
  5. 前記第2のレベルのドキュメント処理動作は、ステープル、または孔開け、または丁合い、または用紙サイズの選択、またはページの向き、またはページ設定、または出力パレットの選択、または出力先、または解像度、または料金の会計処理動作を含むことを特徴とする請求項1に記載のドキュメント処理装置のオーディオビジュアル制御システム。
  6. 前記認識手段は、可聴的に受け取られた料金の会計情報に関するアカウント・データを特定する手段を含むことを特徴とする請求項5に記載のドキュメント処理装置のオーディオビジュアル制御システム。
  7. それぞれが利用可能な第1のレベルのドキュメント処理動作のうちの少なくとも1つを一意的に表す複数の第1のレベルのグラフィック画像を、ディスプレイ端末上に表示するステップと、
    前記利用可能な第1のレベルのドキュメント処理動作のうちの選択された1つに対応する第1の可聴情報をユーザから受け取るステップと、
    前記受け取られた第1の可聴情報にしたがって前記利用可能な第1のレベルのドキュメント処理動作のうちの前記選択された1つのドキュメント処理動作を特定するステップと、
    それぞれが前記選択された第1のレベルのドキュメント処理動作に対応する利用可能な第2のレベルのドキュメント処理動作のうちの少なくとも1つを一意的に表す第2のレベルのグラフィック画像を、前記ディスプレイ端末上に表示するステップと、
    前記利用可能な第2のレベルのドキュメント処理動作のうちの選択された1つに対応する第2の可聴情報をユーザから受け取るステップと、
    前記受け取られた第2の可聴情報にしたがって前記利用可能な第2のレベルのドキュメント処理動作のうちの前記選択された1つのドキュメント処理動作を特定するステップと、
    前記選択された1つの第1のレベルのドキュメント処理動作を特定するステップと、前記選択された1つの第2のレベルのドキュメント処理動作を特定するステップの出力にしたがってドキュメントに対してドキュメント処理動作を開始するステップと
    を含むことを特徴とするドキュメント処理装置のオーディオビジュアル制御方法。
  8. 前記選択された第1のレベルのドキュメント処理動作および前記第2のレベルのドキュメント処理動作のそれぞれに対応する非可聴ユーザ選択データを受け取るステップを、さらに、含むことを特徴とする請求項7に記載のドキュメント処理装置のオーディオビジュアル制御方法。
  9. 前記開始されるそれぞれのドキュメント処理動作は、前記第1のレベルのドキュメント処理動作のみの実行を含むことを特徴とする請求項7に記載のドキュメント処理装置のオーディオビジュアル制御方法。
  10. 前記第1のレベルのドキュメント処理動作は、コピー、または印刷、またはファクシミリ送信、または電子メール送信、または画像走査、または保存処理動作を含むことを特徴とする請求項7に記載のドキュメント処理装置のオーディオビジュアル制御方法。
  11. 前記第2のレベルのドキュメント処理動作は、ステープル、または孔開け、または丁合い、または用紙サイズの選択、またはページの向き、またはページ設定、または出力パレットの選択、または出力先、または解像度、または料金の会計処理動作を含むことを特徴とする請求項7に記載のドキュメント処理装置のオーディオビジュアル制御方法。
  12. 可聴的に受け取られた料金の会計情報に関するアカウント・データを特定するステップを、さらに、含むことを特徴とする請求項11に記載のドキュメント処理装置のオーディオビジュアル制御方法。
JP2008096519A 2007-04-18 2008-04-02 ドキュメント処理装置のオーディオビジュアル制御システムおよび方法 Pending JP2008271542A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/736,987 US20080263447A1 (en) 2007-04-18 2007-04-18 System and method for audiovisual control of document processing devices

Publications (1)

Publication Number Publication Date
JP2008271542A true JP2008271542A (ja) 2008-11-06

Family

ID=39873467

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008096519A Pending JP2008271542A (ja) 2007-04-18 2008-04-02 ドキュメント処理装置のオーディオビジュアル制御システムおよび方法

Country Status (2)

Country Link
US (1) US20080263447A1 (ja)
JP (1) JP2008271542A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010283494A (ja) * 2009-06-03 2010-12-16 Ricoh Co Ltd 画像処理装置、システム、画像処理方法、プログラムおよび記録媒体

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090006989A1 (en) * 2007-06-27 2009-01-01 Samsung Electronics Co., Ltd Image forming method and apparatus, and host
EP3839673A1 (en) * 2014-05-15 2021-06-23 Sony Corporation Information processing device, display control method, and program
US10642896B2 (en) 2016-02-05 2020-05-05 Sas Institute Inc. Handling of data sets during execution of task routines of multiple languages
US10650045B2 (en) 2016-02-05 2020-05-12 Sas Institute Inc. Staged training of neural networks for improved time series prediction performance
US10795935B2 (en) 2016-02-05 2020-10-06 Sas Institute Inc. Automated generation of job flow definitions
US10650046B2 (en) 2016-02-05 2020-05-12 Sas Institute Inc. Many task computing with distributed file system
US10346476B2 (en) * 2016-02-05 2019-07-09 Sas Institute Inc. Sketch entry and interpretation of graphical user interface design
US11227300B2 (en) * 2017-06-09 2022-01-18 Modfind Llc Computer-network-based referral service functions and user interfaces

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6243682B1 (en) * 1998-11-09 2001-06-05 Pitney Bowes Inc. Universal access photocopier
US6253184B1 (en) * 1998-12-14 2001-06-26 Jon Ruppert Interactive voice controlled copier apparatus
US20030020760A1 (en) * 2001-07-06 2003-01-30 Kazunori Takatsu Method for setting a function and a setting item by selectively specifying a position in a tree-structured menu

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010283494A (ja) * 2009-06-03 2010-12-16 Ricoh Co Ltd 画像処理装置、システム、画像処理方法、プログラムおよび記録媒体

Also Published As

Publication number Publication date
US20080263447A1 (en) 2008-10-23

Similar Documents

Publication Publication Date Title
JP2008271542A (ja) ドキュメント処理装置のオーディオビジュアル制御システムおよび方法
US11355106B2 (en) Information processing apparatus, method of processing information and storage medium comprising dot per inch resolution for scan or copy
JP2009065652A (ja) ドキュメント処理装置、方法およびプログラム
US20090161132A1 (en) Image processing apparatus, and control method, and computer-readable storage medium thereof
US8456679B2 (en) System and method for generating a remote job submission accelerator report in a multi-function device
JP2008047106A (ja) ユーザ・インターフェイスをカスタム化するシステムおよび方法
US20090225334A1 (en) Printing of color print data as color image or as black-and-white image
JP2008186458A (ja) 異なるフォーマットで符号化された電子ドキュメントの出力を開始するシステムおよび方法
US9990164B2 (en) Printing method of image forming apparatus and the image forming apparatus
US20130063772A1 (en) Management server, method of managing workform and recording medium
JP2008181521A (ja) ドキュメント処理装置のユーザ・インターフェイス画面をカスタム化するシステムおよび方法
JP2008167436A (ja) ユーザ・インターフェイスをカスタム化するシステムおよび方法
US9110962B2 (en) Data providing apparatus for implementing script, electronic apparatus for implementing script, data processing system for implementing script, and method of data processing for implementing script
JP2009193582A (ja) ドキュメント処理操作を支援するシステムおよび方法
JP2008182678A (ja) ドキュメント処理装置のユーザ・インターフェイスにカスタム標章を付加するシステムおよび方法
JP2010040030A (ja) ドキュメント処理装置の認証システムおよび方法
US20080174808A1 (en) System and method for job submission to an unspecified document processing device
JP2008192133A (ja) 区切りページ出力システムおよび方法。
US8004723B2 (en) Information processing apparatus and image processing apparatus executing script stored in association with storage region
JP2007141241A (ja) ドキュメント処理システム、方法およびプログラム
US11350011B2 (en) Device, process execution system, process execution method, and non-transitory recording medium
US20050225797A1 (en) Printing apparatus and its control method, and program
JP2009146395A (ja) 電子ドキュメントのデータ入力を支援するシステムおよび方法
JP2007329922A (ja) 条件付き文書処理装置開始システムおよび方法
JP2009054153A (ja) ドキュメント処理装置のドライバをカスタム化するシステムおよび方法