JP2005100413A - オーディオ/ビデオ・ローカライゼーション機能を有するプリンタ - Google Patents

オーディオ/ビデオ・ローカライゼーション機能を有するプリンタ Download PDF

Info

Publication number
JP2005100413A
JP2005100413A JP2004278347A JP2004278347A JP2005100413A JP 2005100413 A JP2005100413 A JP 2005100413A JP 2004278347 A JP2004278347 A JP 2004278347A JP 2004278347 A JP2004278347 A JP 2004278347A JP 2005100413 A JP2005100413 A JP 2005100413A
Authority
JP
Japan
Prior art keywords
multimedia
multimedia data
data
event
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004278347A
Other languages
English (en)
Other versions
JP2005100413A5 (ja
Inventor
Jonathan J Hull
ジェー ハル ジョナサン
Berna Erol
エロール ベルナ
Peter E Hart
イー ハート ピーター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/813,946 external-priority patent/US7415670B2/en
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2005100413A publication Critical patent/JP2005100413A/ja
Publication of JP2005100413A5 publication Critical patent/JP2005100413A5/ja
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】 本発明は、マルチメディアデータの扱い及び適用性を向上させることが可能なシステム及び方法を提供する。
【解決手段】 本発明によるマルチメディア印刷装置は、マルチメディアデータを受信し、これを処理し、出力することが可能である。ある実施形態によると、マルチメディア印刷装置で処理されたマルチメディアデータはビデオペーパー、マルチメディア放送、デジタルアーカイブへのバーコード・ポインタなどを含む様々な形式で出力されうる。また、別の実施形態によると、マルチメディア印刷装置はマルチメディアデータを受信し、このデータに基づいてマルチメディアデータを生成する周辺機器に対してオーディオ/ビデオ・ローカライゼーションを実施する。また別の実施形態によると、マルチメディア印刷装置はマルチメディアデータを取り込んでこれを処理するよう指示するコマンドを実行する。例えばマルチメディア印刷装置はこのようなコマンドに応じて予め用意されたドキュメントにマルチメディア・オブジェクトを挿入することができる。
【選択図】 図1A

Description

本発明は一般に印刷システムに関し、特にマルチメディアデータを受信、処理、且つ変換し、これを異なる形式で出力できる印刷システムに関する。
マルチメディア技術分野におけるコストの低下及び品質の向上に伴い、モニター装置及びその適用が広く普及しつつある。家庭や職場などで高品質のビデオカメラやマイクロホンなどが普及していて、これらの装置はテレビ会議、監視モニタ、ワークフロー管理など様々な用途に適用されうる。このようなモニタ装置によって捉えられたマルチメディアデータは典型的には未処理状態でデジタルテープ、ハードディスク、メモリカードなどの媒体に送出される。よってユーザはこのデータから有用な要素を抽出するためにこのデータに対するフィルタ処理として例えば不要なノイズを排除する処理などを実施しなければならない。すなわち活用できる記録を作成するためには多くの場合このデータに対し関連要素を分離するなどの更なる処理を施す必要がある。このようなデータのフィルタ作業は多くの場合厄介でありまたエラーが発生しやすく、ユーザは大量のデータを再生、早送り、巻き戻ししなければならない。例えば監視モニタの応用の場合、主に一定の出来事が起きるのを待機している状態となるため、このような出来事を検出するのに費やされる時間及び資源は相当な量となる。
利用可能な記録を作成するために実施されるマルチメディアデータに対する処理は典型的にはいくつかの異なるステップから構成され、これらステップはそれぞれ相当な労力が要される。
多くの場合ユーザは様々な段階において各種デバイスに対してマルチメディアデータを変換し転送しなければならない。例えばユーザはアナログテープのマルチメディアデータを未処理状態のデジタルファイルへ変換し、これをデータの抜粋を含む要約ファイルへ変換し、さらにはこれをメモリまたは出力装置へ転送するなどの作業を行う必要がある。マルチメディアファイルの処理は通常同じ作業の繰り返しとなる。この作業は例えばミーティングのマルチメディア記録を作成し、この記録からノイズをフィルタし、出席者やその他の識別情報を付加し、処理済のマルチメディア記録をミーティングの出席者に送信するなどに相当しうるが、このような作業を自動化する技術はない。また、このような記録データは典型的には紙などに印刷されないため、このようなデータを主に紙ベースのワークフローに基づいて機能するほとんどのオフィスにおいて導入することは困難である。なお、従来技術においてこのようなマルチメディアデータを紙への出力用にマッピングする技術などが存在する。例えば理解可能なマルチメディア記録を対話形式に書き写し、あるいはビデオ記録から画像やフレームを抽出してこのデータを印刷する技術などがあるが。このような変換ステップは自動化されていなくまた実施されることもまれである。
本発明は従来技術の問題点を克服することを目的とし、具体的にはマルチメディアデータを受信し、これを処理し、その処理結果を紙などの媒体に出力することが可能なシステム及び装置を提供することを目的とする。
本発明は、マルチメディアデータがマルチメディア処理装置において受信され、処理され、その処理結果が出力されるようなシステム及び装置を提案する。また、ある実施形態によると、本発明は周辺機器によって取得され、マルチメディア処理装置によって受信されたデータに基づいて同周辺機器(または別の周辺機器)への制御信号を生成する装置及び方法を提案する。また、別の実施形態によると、マルチメディア処理装置はマルチメディアデータを処理し且つマルチメディア事象の発生に対する応答動作を実施するコマンドを受信し、この事象を検出した場合はこのコマンドを実施する。
本発明は、マルチメディアデータを取得してからこのデータを好適な形式で出力するまでの間における同マルチメディアデータの管理を実現するためのシステム及び方法を提供する。本発明の実施形態においては、モニタリング機能、処理機能、及び出力機能を統括することでモニタリング、記録、などに関する様々な課題に対する総合的な解決手段が提供されうる。本発明が実現するマルチメディアデータの統括的な管理により例えば以下のような効果が得られる。すなわち、本発明の実施形態によりマルチメディアデータのモニタリング及び処理の効率が向上し、マルチメディアデータから有用な情報を抽出するのに要されるステップの数が削減され、マルチメディアデータが政策決定や分析により大きく反映されるなどの効果が得られる。
図1Aは本発明の好適な一実施形態に従って構成されるシステム101を示す図である。このシステム101は周辺機器155を含むマルチメディアデータソース、マルチメディア処理装置100、プロセッサ装置160、電子データ記憶装置又は媒体180、及び出力ドキュメント170から構成される。ここでマルチメディア処理装置100はビデオカメラなどに相当しうる周辺機器155に結合されこの機器から信号線130を介してビデオストリームを受信する。このマルチメディア処理装置100は同装置に供給されている事象プロフィールに基づき、受信したデータストリーム中の所定の事象を検出するように構成される。このマルチメディア処理装置100はこのような事象を分離し、ビデオカメラによって取得されたデータストリームをいくつかの関連性の高い画像やイメージクリップに編成することができる。そしてマルチメディア処理装置100はこの編成画像又はクリップを紙又は電子ドキュメントなどに出力する。このようにマルチメディア処理装置100はユーザが重要性のある事象を検出するために多量のデータを捜査する作業を代行する好適で携帯可能な実施を実現する。
なお、本発明の説明において、「マルチメディアデータ」、「マルチメディアファイル」、「マルチメディア情報」又は「マルチメディアコンテンツ」とはビデオデータ、オーディオデータ、グラフィックデータ、アニメーションデータ、知覚データ、静止ビデオ、スライド情報、ホワイトボード画像情報、及び/又はその他各種データのうちの1つ又はこれらの組み合わせなどに相当しうる。このデータはアナログ形式で磁気テープなどに記憶されるか、あるいは様々な形式のデジタルファイルという形をとることも可能である。例えばこのファイルはASF,Divx、3DO、MMX(.mmx)、SDMI(.sdmi)、SMIL(.smil)、MP3(.mp3)、WAV(.wav)、磁気テープ、デジタルオーディオテープ、各種MPEG形式(MPEG1、MPEG2、MPEG4、MPEG7など)、HTML+TIME、WMF(Windows(登録商標)Media Format)、RM(Real
Media)、Quicktime、Shockwave、各種ストリーミングメディア形式、エンジニア業界で開発されている各種形式や、各種専有及び共有形式などをとることができる。また、マルチメディアデータはその他の形式のファイルから構成されることも可能である。
また、本発明の説明において言及されるマルチメディアデータは様々な方法によってマルチメディア処理装置100に供給されることが可能である。例えばこのマルチメディアデータはストリーミングコンテンツ、マルチメディア取得装置からの生データ、ディスクリート・ファイル、又はより大きなファイルの一部としてマルチメディア処理装置100に供給されうる。また、本発明の説明において「印刷」という表現が何らかの媒体に印刷を行うという文脈で用いられる場合これは、印刷、書き込み、描出、押印、エンボス加工、デジタル形式でのデータ生成や、その他の方法によるデータ提示出力の生成を含むものとする。また「ドキュメント」及び「紙」という用語は本発明によるシステム101の出力を指し、これらは紙媒体などの物理的媒体に限られない。すなわち上記用語は実体のある媒体に配当されるあらゆる出力に相当しうる。本発明の一実施形態として、システム101の出力はマルチメディアデータが物理的な紙ドキュメントに印刷された形で提示されうる。このように紙ドキュメントを生成することにより、本発明の実施形態では携帯性に優れた読める形式でのマルチメディア情報を提供することができる。
以下において本発明の理解を容易にする目的で本発明の好適な実施例の特徴を詳細に説明する。しかし同業者には自明であるように本発明はこれらの実施例における詳細な特徴を適用せずに実現することも可能である。なお、本発明の明確な理解を可能にするために本発明に係る構造や装置はブロック図によって示される。
また、本発明の説明において用いられる「一実施形態」または「ある実施形態」などという表現は、当該実施形態に関連して示される特定の機能、構造又は特徴が本発明の範囲に含まれる少なくとも1つの実施形態において適用されるものであることを意味する。また、本発明の説明で「ある(一)実施形態によると」などといった表現が各所で用いられているが、これらは必ずしも同一の実施形態に言及しているとは限らない。
上述の図1Aは本発明の一実施形態によるマルチメディア処理装置又はマルチメディアプリンタ100の構成をブロック図によって示す。このマルチメディア処理装置100は好適にはマルチメディア・インタフェース102、メモリ104、プロセッサ106、及び出力系108から構成される。
ある実施形態によると、図示されるように周辺機器155からのマルチメディアデータ150がマルチメディア処理装置100に結合される信号線130aを介してこのマルチメディア処理装置100のマルチメディア・インタフェース102に供給される。なお、ここでの「信号線」とは、あらゆる通信装置、ルータ、またはプロトコルなどによって支持される接続及び接続の組み合わせを含み、例えばデジタル、アナログ、衛星、無線、ファイアワイヤ(IEEE1394)、802.11、RF、ローカル及び/又はワイドエリアのネットワーク、イーサーネット、9ピンコネクタ、パラレルポート、USB,シリアル又は小型コンピュータシステムインタフェース(SCSI)、TCP/IP、HTTP、Eメール、ウェブサーバーなどによって支持される接続を含む。ある実施形態によると信号線は2方向通信を容易にすることができる。また別の実施形態によるとこの信号線は1方向通信のみを支持する。例えば信号線130aは取得されたデータを周辺機器155からマルチメディア処理装置100へ転送可能にすると共に、周辺機器155の方向性を変えるためのコマンド信号をマルチメディア処理装置100から周辺機器155に送信可能にする。なお、マルチメディアデータ150はマイクロホン、ビデオカメラ、センサー、及びその他のマルチメディア取得/再生装置など様々な周辺機器からのデータの相当しうる。また、このマルチメディアデータ150はテープ、ディスク、フラッシュメモリ、スマートドライブ、CD−ROM、DVDやその他の磁気/光学/一時的コンピュータ又は半導体メモリなどからのデータであってもよい。ある実施形態によると、データ150はマルチメディア処理装置100によって記憶媒体から各種カード、ディスク、又はテープ読取器などを介してアクセスされうる。なおこれらのアクセス手段は同マルチメディア処理装置100に搭載されていてもされていなくてもよい。
ある実施形態によると、マルチメディアデータ150はマルチメディアデータソース又は周辺機器155から信号線130aを介して受信される。また、このデータは例えばマルチメディアファイルのデータベースのホストサーバーなどからネットワーク上の信号線130aを介してマルチメディア・インタフェース102に送信されうる。また、マルチメディアデータは受信器(パラボラアンテナやケーブル受信器など)からのデータであってよく、この場合受信器は外部ソース(非図示)からのマルチメディアデータを受信あるいは取得してこのデータを信号線130a経由でマルチメディア・インタフェース102に供給する。
このようにしてマルチメディアデータ150は信号線130aからデータを受信するように構成されるマルチメディア・インタフェース102に供給される。このマルチメディア・インタフェース120はパラレル、USB、シリアル、SCSI、ブルートゥース(登録商標)/IR受信器などの典型的な通信ポートを具備し、また、ディスクドライブ、アナログテープ読取器、スキャナ、ファイアワイヤ、IEEE1394、インターネット、またはその他のデータインタフェースやデータ通信インタフェースを具備しうる。
データを受信したマルチメディア・インタフェース102はこのマルチメディアデータ150またはこれを処理したものをシステムバス110に供給する。システムバス110はISA(Industry Standard Architecture)バス、PCI(Peripheral Component Interconnect)バス、USB(Universal Serial Bus)、またはその他上記同様の機能を実現しうる既知のバスのうちの1つまたは複数を表す。ある実施形態によると、マルチメデォアデータ150がアナログ形式で受信された場合、このデータはまず一般的なアナログ/デジタル変換器によってデジタル形式の処理可能データに変換される。同様にマルチメディアデータ150がビデオペーパーなどの紙の入力である場合、マルチメディア・インタフェース102はこの紙ドキュメントに記録されるマルチメディアデータにアクセスするために例えばバーコード読取機能及び/又は光学式文字読取(OCR)機能などを備えることがありうる。こうしてマルチメディアデータ150はデジタル形式でマルチメディア処理装置100のシステムバス110に送信される。
なお、図1Aの例ではマルチメディアデータ150は信号線130aを介してマルチメディア処理装置100に送信される。しかし他の実施形態によってはこのマルチメディアデータ150はマルチメディア処理装置100内で生成され、この生成データがシステムバス110によってプロセッサ106に送信されることも可能である。例えばマルチメディアデータ150はマルチメディア処理装置100において映像作成ソフトや、ビデオエディタや、その他同様のマルチメディアツール(非図示)などによって作成されうる。このようにしてマルチメディア処理装置100でデータが作成されると、これに応じてマルチメディアファイルが例えばシステムバス110を介してプロセッサ106やメモリ104などに送信されうる。また別の実施形態によると、マルチメディア処理装置100は周辺機器155としてのデジタルマルチメディアリコーダを有し、これによりマルチメディア処理装置100外部で発生する音や画像が記録されうる。このようにして取得されたデジタル信号からなるマルチメディア記録はこのマルチメディア処理装置100によって更に処理されうる。
また、マルチメディアデータ150の処理/出力などを要求するコマンド190がマルチメディア処理装置100と結合する信号線130bを介してマルチメディア処理装置100に送信されることも可能である。ある実施形態によると、コマンド190はユーザの希望する変換、処理、及び出力形態などを反映する。このようなコマンドは例えばマルチメディアデータ150をアナログからデジタル形式に変換する指示や、デジタル形式からアナログ形式へ変換する指示、あるデジタル形式から別のデジタル形式へ変換する指示などであってよい。また別の例として、コマンド190は、プロセッサ106に一連の変換動作を実施するように指示し、あるいは生または処理されたマルチメディアデータ150をインデックス形式に編成するように指示することも可能である。また、ある実施形態によると、コマンド190は処理されたマルチメディアデータ150がどこに出力されるべきかを指定しうる。例えばコマンド190はマルチメディアデータ150を紙ドキュメント170、電子データ180、携帯記憶媒体などを出力として指定することができる。具体的な例として、デジタル信号という形で信号線130bを介してバス110へ送信されるある特定のコマンドの集合は、MPEG形式のマルチメディアデータ150をより小さな形式に圧縮し、これをバーコード化し、その結果をさらにCDに焼くよう指示することが可能である。
また、ある実施形態によると、プロセッサ106へのコマンド190は処理されたマルチメディアデータ150を紙ドキュメント170に出力するように指示する。この場合これらのコマンド190は好ましくはドキュメント上のページレイアウトをプロセッサ106によって認知可能である形式のデジタル信号という形で記述していて、この信号が信号線130bを介してプロセッサ106に送信さる。このコマンド190の記述形式としては、例えばPDL(ページ記述言語:Page Description Language)、PCL(プリンタコマンド言語Printer Command Language)、GDI(グラフィックス装置インタフェース:Graphical Device Interface)形式、アボード社のポストスクリプト言語、ベクトルベース又はビットマップベース言語などが適用されうる。なお、PDL及びその他の形式に基づくマルチメディア処理装置100との通信を容易にするために、例えばここにおいて本願に参照により挿入される以下の米国特許出願で開示される通信プロトコルが、適用されうる。
“Printer With Embedded Retrieval and Publishing Interface”と題されるHull et. alによる米国特許出願10/814,536号(2004年3月30日出願)は、マルチメディア情報又はマルチメディアコンテンツへのポインタを含有するデータを受信し、受信したドキュメントデータに応じて各種動作を実行するプリンタにおいて適用されるシステム及び方法を開示する。ある実施形態によると、プリンタはマルチメディアコンテンツへのポインタなどのマルチメディア情報を受信し、これに応じてマルチメディアコンテンツを取得し、このマルチメディアコンテンツを表示するドキュメントを印刷する。またある実施形態によると、プリンタは更に取得されたマルチメディアコンテンツをデータベース又はローカルストレージに記憶する。また、ある実施形態によると、プリンタは示装置からアクセス可能な(例えばネットワークを介して、あるいはローカルストレージから)マルチメディアコンテンツを収集し、この収集されたマルチメディアコンテンツの要約ドキュメントを印刷する。プリンタの動作は好ましくはこのプリンタによって受信されたドキュメントのコンテンツに基づいて実行される。このコンテンツとして例えば、印刷可能データ又は印刷不能データなどを含むことができる。ある実施形態によると、このドキュメントは印刷用に送信される前にデータ処理システムによって分析され、これにより同ドキュメントに付加的なデータが追加されるかあるいは結合される。さらに、ある実施形態によると、著者やその他のユーザがデータベースの名前や、特別印刷コマンド、ウェブページへのポインタなどの付加的な情報を提供する。また別の実施形態によると、データ処理システムにおけるプラグインソフトがドキュメントを分析し、このコンテンツについての付加的な情報を提供する。また別の実施形態によると、データ処理システムにおけるプリンタドライブソフトがドキュメントを分析し、同ドキュメントもコンテンツについての付加的な情報を提供する。更に別の実施形態によると、プリンタがドキュメントを受信した後これを分析する。また、ある実施形態によると、プリンタは受信したドキュメントに応じてマルチメディアデータを取得し、この受信したドキュメントに応じてドキュメントを印刷する。また、ある実施形態によると、取得されたマルチメディアデータは局所的に記憶されるか、あるいはウェブサイトなどに記憶される。これによって例えばMP3オーディオファイルまたはビデオファイルを指すURLなどが「印刷」されることとなる。また、データをダウンロードするのに時間がかかる場合などは、この作業が背景で実施されることがユーザにとっては望ましい。その後ユーザはこのプリンタをサーバーとするウェブページにおけるオーディオファイル及びビデオファイルのリストを見ることができ、また選択したファイルをオンデマンドで再生することができるようになる。さらにユーザはこのウェブページからこれらのファイルのビデオペーパーを作成することができる。これによって紙のドキュメントが生成されることになりうるが、また別例ではこのビデオペーパーの電子表示(例えばPDFなど)が生成されうる。また、バーコードがプリンタによって取得された後のマルチメディアの場所を示すようにすることも可能である。
“Printer With Document-Triggered Processing”と題されるHull et. alによる米国特許出願10/814,580号(2004年3月30日出願)は、ドキュメントを印刷する動作と共に、あるいはこの代わりに印刷ドキュメントの特性を検出し、これに応じた動作をトリガーすることが可能なプリンタにおいて適用されるシステム及び方法を開示する。例えばこのようなプリンタはドキュメントのフィールドや値を電子形式で抽出し、この情報をデータベースに記憶することができる。このシステムは更にこのプリンタによって実施された動作を何らかの形で反映する紙ドキュメントの作成を可能にする。プリンタの動作は好ましくはこのプリンタが受信するドキュメントのコンテンツに基づく。このコンテンツは印刷可能データ及び印刷不能データを含むことが可能である。ある実施形態によると、ドキュメントは印刷用に送信される前にデータ処理システムによって分析され、これによりこのドキュメントに付加的な情報が追加あるいは結合される。さらに、ある実施形態によると、著者やその他のユーザがデータベースの名前などの付加的な情報を提供する。また別の実施形態によると、データ処理システムにおけるソフトがドキュメントを分析し、特定データフィールドのコンテンツなどこのドキュメントコンテンツについての付加的な情報を提供する。更に別の実施形態によると、ドキュメントはプリンタによって受信された後分析される。これらの実施形態においてプリンタは(印刷という動作に加えて、あるいはこれの代わりに)ドキュメントのコンテンツに応じて動作を実施する。また、ある実施形態によると、プリンタがドキュメントのコンテンツに応じた動作を実施する前の段階においてプリンタ及び/又はプリンタ側に係属する構成要素がユーザ又はドキュメントソースと交信しうる。
さらにマルチメデォアデータ150を紙に印刷する場合コマンド190は、紙ソース、ページフォーマット、フォント、余白、ページレイアウトオプションなどを指定することができる。また、コマンド190は様々なソースから発されることが可能であるが、その一例としてコマンド190は信号線130cを介してマルチメディア処理装置100と結合する処理装置160におけるプリントダイアログをソースとすることも可能である。このプリントダイアログは例えばユーザがマルチメディア処理装置100にマルチメディアデータ150を送信しようとするたびに発生するようにプログラムされうる。
またグラフィック・ユーザインタフェースに提示される選択オプションに対する応答という形をとるコマンド190が信号線130b、130c、または130dを介してプロセッサ106へ送信されることも可能である。なお、このグラフィック・ユーザインタフェースとしては例えばここにおいて本願に参照により挿入される以下の米国特許出願で開示されるインタフェースを適用することが可能である。
“Printer User Interface”と題されるHart et. alによる米国特許出願10/814,700号(2004年3月30日出願)は、時間ベースメディアを印刷することができ且つユーザインタフェースを介して操作される複合プリンタを開示する。このユーザインタフェースは、コマンド入力を受信し且つユーザに情報を提供するためのタッチスクリーンを有する。プリンタは時間ベースのメディアデータをこのユーザインタフェースを介して指定されたメディアソースから受信する。ユーザはこのプリンタがこのデータに対して適用すべき1又は複数のマルチメディア処理機能を指定できる。これに応じてプリンタは指定された昨日を実施し、この出力のプレビューをユーザインタフェースのディスプレイを介してユーザに示す。ユーザがこのプレビュー出力を印刷することを決定した場合、ユーザは1又は複数の出力装置を指定し、このプリンタが一般的な印刷出力及び/又は特定の電子出力を提供できるようにする。
また、“User Interface for Networked Printer”と題されるHart et. alによる米国特許出願10/814,500号(2004年3月30日出願)も、時間ベースメディアを印刷することができ且つユーザインタフェースを介して操作される複合プリンタを開示する。このユーザインタフェースは、コマンド入力を受信し且つユーザに情報を提供するためのタッチスクリーンを有する。プリンタは時間ベースのメディアデータをこのユーザインタフェースを介して指定されたメディアソースから受信する。ユーザはこのプリンタがこのデータに対して適用すべき1又は複数のマルチメディア処理機能を指定できる。これに応じてプリンタは指定された昨日を実施し、この出力のプレビューをユーザインタフェースのディスプレイを介してユーザに示す。ユーザがこのプレビュー出力を印刷することを決定した場合、ユーザは1又は複数の出力装置を指定し、このプリンタが一般的な印刷出力及び/又は特定の電子出力を提供できるようにする。
また、上述のような選択オプション及びこれに対する応答はハードウェアディスプレイによって提示されうる。例えばこれらオプション及び応答は、信号線130aによってマルチメディア処理装置100に結合されているか、あるいはマルチメディア処理装置100の一部として導入されている周辺機器155に具備されるタッチスクリーン又はキーパッドなどによって提示されることが可能である。そしてこれらのコマンドは周辺機器155と接続する信号線130bを介してマルチメディア処理装置100に送信されるか、あるいは直接マルチメディア処理装置100に供給されうる。
また別の実施形態によると、ある装置に具備される一般的なソフトを調整し、ユーザの処理及び出力オプションの選択を促し、この選択オプションをマルチメディア処理装置100のプロセッサ106に送信するようにすることも可能である。このようなソフトは、例えばウィンドウズ(登録商標)・メディアプレーヤなどのマルチメディア提供アプリケーションに「印刷」オプションを追加することを可能にするドライバや、特製プログラム、ソフトウェア・プラグインなどによって変更されうる。また、ここにおいて本願に参照により挿入される“Multimedia Print Driver Dialog Interfaces”と題されるHull et. alによる米国特許出願10/814,944号(2004年3月30日出願)においてマルチメディアデータを制御・管理するために適用される様々なインタフェースの実施形態が開示される。
具体的には上記米国特許出願は、ユーザがマルチメディア変換プロセスと対話し、マルチメディアデータをフォーマットしてマルチメディアデータの表示を作成することを可能にするメディア印刷インタフェース、並びにこれを適用するシステム及び方法を開示する。このユーザインタフェースによりユーザはメディアコンテンツ分析及びメディア表示の作成に干渉することができる。ある実施形態によると、メディア分析ソフトウェアモジュールはユーザからユーザインタフェースを介してメディアコンテンツの分析を指示するコマンドを受信すると、これに応じてメディアコンテンツの様々な特徴(例えば顔、発話、テキスト、など)を分析・検出する。メディア表示は紙ベースの形式、デジタル形式、あるいはその他あらゆる表示形式で作成されうる。ユーザインタフェースは複数のフィールドを有し、これを通してユーザはメディアコンテンツをみて作成されるメディア表示の変更を行うことができる。ある実施形態による方法は、メディアデータ分析及びメディア表示作成を制御するためにユーザインタフェースと対話し、メディアデータの特徴を分析する工程を含む。またある実施形態による方法はメディア表示パラメータに関するコマンドを受信・送信することによりメディアデータ分析プロセス及びメディア表示作成プロセスを起動する工程を含む。更にこれらの方法はメディア表示を生成する工程を含みうる。
なお、上述のように図1Aおけるマルチメディア処理装置100のプロセッサ106は信号線130bを介して各種処理コマンド190を受信するように構成されるが、これとはまた別の実施形態によると、処理コマンド190はマルチメディア処理装置100に直接入力されるかあるいはここで生成されることも可能である。また別の実施形態によると、マルチメディア処理装置100はマルチメディアデータ150を処理するコマンドを受信することなく、その代わりに例えば特定のデータ150を受信した際、これに応じて自動的に実行すべき処理ステップを規定する論理を含む。例えばマルチメディア処理装置100はMP3又はWAVファイルを受信するたびにこれをマルチメディアに変換し、この結果得られたマルチメディアファイルを信号線130dよりアクセス可能なネットワーク上にあるサーバーに記憶するようにプログラミングされることが可能である。
また、図1Aに示されるように、マルチメディア処理装置100は信号線130a、130bからマルチメディアデータ150及びコマンド190を受信し、処理されたマルチメディアデータ150を、信号線130cを介して紙ドキュメント170として出力するか、あるいは信号線130dを介して電子データ180として出力する。なお、マルチメディア処理装置100はマルチメディアデータ150への適用のためにカスタマイズされることが可能であって、図2に示すような各種モジュール200〜216や、マルチメディアデータ150を生成するための各種周辺機器(例えばここでは図示されないが、電子キーボード、ビデオレコーダなど)を備えることが可能である。なお、ここにおける「モジュール」という用語はハードウェア、ファームウェア、及び/又はソフトウェアに具備されうる特定機能を提供するためのプログラム論理を指すことができる。ある実施形態によると、マルチメディア処理装置100は紙出力を生成する機能を有する印刷装置であって、場合によっては電子出力を生成する機能をも有しうる(これは有さなくてもよい)印刷装置を構成する。ここにおいて「印刷装置」又は「プリンタ」とはマルチメディアデータ150を受信し、紙ドキュメントを印刷する機能を備え、随意にファックス機能、コピー機能、及び/又はその他物理的ドキュメントを生成するための機能を備えることができる装置を指す。なお、この印刷装置は一般的なレーザ、インクジェット、携帯用、バブルジェット(登録商標)、手持ち式、又はその他のプリンタや、複合プリンタ・コピー機、デジタル送信機、プリンタ・スキャナ、特殊写真用又は携帯用プリンタ、その他紙ドキュメントを印刷可能な装置などに相当しうる。また、印刷装置は、ここにおいて本願に参照により挿入される“Printer with Multimedia Server”と題される米国特許出願10/814,842号(2004年3月30日出願)及び“NEP Apparatus”と題される米国特許出願(2004年3月30日出願)に開示される特殊印刷装置を構成することも可能である。また、ある実施形態によると、印刷装置はマルチメディアデータを受信し、及び/又は電子データを出力するように適応された一般のプリンタであってもよい。
なお、上記米国特許出願10/814,842号は、埋め込みマルチメディアサーバーを有するプリンタを開示する。このプリンタは主に印刷制御を実現するためのプロセッサ及びマルチメディアサーバーと各種形式のメディア用のハードウェア及び/又はソフトウェアインタフェースとの交信を実現するための別のプロセッサを有する。このようなインタフェースの例としてはネットワークインタフェースや、VGAポート、トランスコーディング・ハードウェア、無線インタフェース、(USB)ポートなどがある。処理されるメディアの例としては、ビデオ、オーディオ、及びテキストなどがある。マルチメディアサーバーは特に時間ベースのデータなどのマルチメディアコンテンツの処理を実施する。この例としては、編集、フォーマット、コンテンツ取得のスケジューリング、検索、認識、及び事象検出などが挙げられる。また、プリンタはマルチメディア・ストレージ・データベースを提供することも可能である。プリンタはその胴体にウェブブラウザを有するユーザインタフェースを具備することができる。よってユーザはプリンタと直接交信して、マルチメディアコンテンツ処理に関する要求や所望の出力媒体への印刷に関する選択を示すことができる。
マルチメディア処理装置100は好ましくはデータを複数種類の形式で出力することができる出力系108を有する。例えば出力系108は好ましくは一般のプリンタ及びCDやDVDへ書き込みができるディスクドライブからなる。また、出力系108はラスタ画像プロセッサや、その他マルチメディアデータ150を紙ドキュメント170上に出力するためデバイスやモジュールから構成されることも可能である。また別の実施形態によると、出力系108はプリンタ及び不揮発性メモリにデータを記憶するための1又は複数のインタフェースから構成されうる。この不揮発性メモリとしては、ROM、PROM(Programmable Read-Only Memory)EPROM(Erasable Programmable Read-Only Memory)、EEPROM(Electrically Erasable Programmable Read-Only Memory)、フラッシュメモリ、RAM(Random Access Memory)などが挙げられる。また、出力系108は、携帯電話メモリカード、PDAメモリカード、フラッシュメディア、メモリスティック、またはその他の携帯用媒体に電子データ180を記憶するためのインタフェースを有することも可能である。この出力された電子データ180はその後特定のターゲットデバイスからアクセスされうる。ある実施形態によると、出力系108は信号線130dを用いて処理されたマルチメディアデータ150をこのデータを添付したEメールという形でネットワークインタフェース(非図示)を介して所定のアドレスへ出力することも可能である。また別の実施形態によると、処理されたマルチメディアデータ150は信号線130dを介してこのデータをレンダリングあるいは放送するCDプレーヤやメディアプレーヤなどのレンダリング/再生装置(非図示)に送信されうる。また別の実施形態によると、信号線130dはイーサーネット・コネクションなどのサーバーへの接続を構成し、ここに処理されたコンテンツを記憶するためのアーカイブを設けるような構成にすることが可能である。またこの他の出力形式を適用することももちろん可能である。
マルチメディア処理装置100は更にプロセッサ106及びメモリ104を有する。プロセッサ106はバス110を介して送信されてくるマルチメディアデータ150信号の処理に関連するタスクを実行するための論理を備える。このプロセッサ106は例えばRISC(Reduced Instruction Set Computer)アーキテクチャ、CISC(Complex Instruction Set Computer)アーキテクチャや、インストラクションセットの組み合わせを実現するアーキテクチャなど様々な演算アーキテクチャを具備しうる。ある実施形態によると、プロセッサ106は、例えばINTELx86、SUN
MICROSYSTEMS SPARC、POWERPC適応CPUなどパソコンに搭載される汎用のプロセッサに相当しうる。なお、図1Aにおいてはプロセッサ106が1つ示されるが、複数のプロセッサを設けることも可能である。
マルチメディア処理装置100のメモリ104はいくつかの機能を具備しうる。まずこのメモリ104はプロセッサ106によって実行されうるインストラクションやこれに関するデータ(ソフトやその他の要素を含む)を記憶することができる。このインストラクション及び/又はデータはここで示される機能の一部あるいはすべてを実行するためのコードを構成することが可能である。メモリ104は例えばDRAM(Dynamic Random Access Memory)装置、SRAM(Static Random Access Memory)装置、又はその他既知の記憶装置に相当しうる。メモリ104は更にプロセッサ106で処理されたマルチメディアデータ150を記憶するためのデータ・アーカイブ(非図示)を含むことが可能である。また、マルチメディアデータ150が最初に信号線130aを介してマルチメディア処理装置100に送信されてきた際このデータ150は処理される前に一時的にメモリ104に記憶されることが可能である。また、メモリ104に記憶される他のモジュール200〜216は、例えばマルチメディアデータを処理し、インデックス化し、記憶するなどの各種機能を支持しうる。以下において本発明による実施形態に係るモジュールの例を図2を参照しながら詳細に説明する。
なお、図1Aの例では電子データ出力180が信号線130dを介してマルチメディアデータ処理装置100の外部に送信されるように示されているが、また別の実施形態においてはこの電子データ出力180はマルチメディア処理装置100内にとどまることも可能である。例えば処理されたメディアデータ150は、外部媒体に出力される代わりに、メディア処理装置100のメモリ104内に記憶されるリポジトリ(非図示)に記憶されうる。また、マルチメディア処理装置100はスピーカ(非図示)やその他の放送装置を含むことも可能である。この場合マルチメディアデータ150はマルチメディアカードやその他のマルチメディア処理論理によって処理され、バス110を介してスピーカなどの遠隔放送装置に出力されうる。なお、本発明の出力系108は実施形態によっては紙ドキュメント出力170及び電子データ出力180の両機能を有さない場合がある。すなわち一部の実施形態では、これらの出力形式のいずれか1つのみを適用する。
図1Aのマルチメディア処理装置100は処理装置160と通信できるように構成される。ある実施形態によると、マルチメディア処理装置100はマルチメディアデータ150を処理するのに要される負担をこの処理装置160と分担するかあるいはこの装置に負担をシフトすることが可能である。処理装置160は例えばバスに結合されるプロセッサ(非図示)を1以上有するパソコンなどに相当しうる。このバスにはメモリ、記憶装置、キーボード、グラフィックスアダプタ、ポインタ装置、及びネットワークアダプタなどが結合されうる。またグラフィックスアダプタにはディスプレイが結合されうる。なお、処理装置160のプロセッサは例えばINTELx86、SUN
MICROSYSTEMS SPARC、POWERPC適応CPUなどに相当しうる。なお、処理装置160はこれらの要素すべてを含む必要はないが、少なくともプロセッサ及びマルチメディア処理装置100と通信を行うためのインタフェースを含む。ある実施形態によると、処理装置160はマルチメディア処理装置100から信号線130cを介して未処理のマルチメディアデータ150を受信する。これに応じて処理装置160はこのマルチメディアデータ150を処理し、処理されたマルチメディアデータ150を信号線130c経由でマルチメディア処理装置100に戻す。続いてこのマルチメディア処理装置100の出力系108がこの処理されたマルチメディアデータ150を紙ドキュメント170または電子データ180として出力する。また別の実施形態によると、マルチメディア処理装置100と処理装置160は処理負担を共有するか、あるいは対話式に相補的な処理動作を実行し、データやインストラクションを相互に信号線130cを介して送信しあう。
図1Bはオーディオ/ビデオ・ローカライゼーションを実現するマルチメディアプリンタの好適な実施形態を示す。この図では印刷装置70、1対のマイクロホン10、ビデオカメラ20、PC165、及び出力例としての紙ドキュメント170が示される。図示されるようにマイクロホン10及びビデオカメラ20はデータを直接印刷装置70に供給する。マイクロホン10によって取得されたデータはバス線110を経由してオーディオ用アナログ・デジタル変換器30に供給される。同様にビデオカメラ20からのビデオデータは、データストリームからキーフレームを分離する機能を有するビデオフレームグラバー40に供給される。図示されるように周辺機器10,20と印刷装置70とは相互間で2方向通信を行えるように接続され、例えば印刷装置70のプロセッサ106がローカライゼーション処理を実行した後にマイクロホン10を傾けるあるいは調整するためのコマンドや、ビデオカメラ20を傾ける、パンする、ズームする、あるいは調整するためのコマンドなどを周辺機器10及び/又20に送信できるようにする。このようなコマンドを受信し実行することにより、周辺機器10,20はより高品質のデータを取得することができる。また、マルチメディアデータ及び処理サポートはPC165をソースとし、ここから提供されることも可能である。
図2は本発明の一実施形態による図1Aのマルチメディア処理装置100のメモリ104の構成を示すブロック図である。メモリ104はバス110によってプロセッサ106やマルチメディア処理装置100における他の構成要素に結合されていて、同マルチメディア処理装置100が実現する処理機能の一部又は全部を実施するためのインストラクション及び/又はデータを格納しうる。ある実施形態によると、図2のメモリ104は図1Aの処理装置160またはその他の装置をホストとすることができる。この場合マルチメディア処理装置100のプロセッサ106は処理装置160に配属するメモリ104と信号線130cを用いてこの処理装置100,160間の通信を容易に実現するためのインタフェースを介して通信する。なお、本発明の実施形態によっては図2に示されるメモリ104のモジュール200〜216のうちの1つ又は複数がマルチメディア処理装置100のメモリに具備されてなく、また処理装置160のほうに記憶されている場合などもあるいる。また、これ以外のモジュールを適用することも可能である。
図2のメモリ104は、バス110によってマルチメディア処理装置100のプロセッサ106及びその他の構成要素に結合されるメインシステムモジュール200、各種処理モジュール204〜216及び処理ストレージ202から構成される。この処理ストレージ202は処理の各段階におけるオーディオ/ビデオデータ及びその他この処理に関するデータを記憶するよう構成される。図2において、処理ストレージ202はメモリ104の一部を構成し、オーディオ/ビデオデータの処理に関連するデータを記憶するために設けられる。しかし同業者には自明であるように、処理ストレージ202は他にもデータベース、サブルーティンや、その他の機能を備えることが可能であり、またこれらの機能はそれぞれマルチメディア処理装置100又は処理装置160の一部を構成しうる。メインシステムモジュール200は、処理ストレージ202と、マルチメディア処理装置100における他の構成要素と、モジュール204〜216との間の中央インタフェースとしての機能を果たす。本発明の各種実施形態においてこのメインシステムモジュール200はプロセッサ106やその他の構成要素からシステムバス110を介してオーディオ/ビデオデータの処理に関する入力を受信する。メインシステムモジュール200はこの入力を解釈し、モジュール204〜216のうち適正なモジュールを起動させる。またこのシステムモジュール200はこの入力に関連するデータをメモリ104の処理ストレージ202から取り出し、適正なモジュール204〜216に転送する。これに対しそれぞれのモジュール204〜216はプロセッサ(典型的にはプロセッサ106)を用いてこのデータを処理し、その結果をシステムモジュール200に返信する。続いてこの結果が出力系108に転送され、紙ドキュメント170又は電子データ180として出力されうる。
ある実施形態によると、システムモジュール200は、所望の結果を得るためにはどの一連ステップをどの順序で実施すべきかを把握するための論理を含む。例えばシステムモジュール200はシステムバス110から所定の事象が起きた場合に実行すべき所定の一連動作を規定するインストラクションのセットを受信しうる。したがってシステムモジュール200はこれらのインストラクションを解析し、この事象を検出できるようにマルチメディアデータをモニタしなければならないことを把握する。更にこの事象が実際に起きた場合は、各種事象トリガーやこれらに対応する動作を格納する事象テーブルをアクセスできるようにしなければならないことを把握する。システムモジュール200はこの事象テーブルから取り出される情報に基づいて所望の動作を開始させることができる。なお、システムモジュール200は以下に説明する各種モジュールに対してこの所望の処理に要される動作及びその他のステップの実施を指示するコマンドを送信することによってこれら所望の動作やステップを実現することができる。
フィルタリング/処理モジュール214はバス110を介してシステムモジュール200と処理ストレージ202とに結合する。このフィルタリング/処理モジュール214に関連する入力を受信した場合システムモジュール200は、このフィルタリング/処理モジュール214に対してマルチメディア処理装置100によって受信されたマルチメディアデータ150をフィルタあるいは処理し、その結果を処理ストレージ202に記憶するような指示信号を送信する。ある実施形態によると、フィルタリング/処理モジュール214は、オーディオデータのルーチン背景ノイズをフィルタ氏、データを平滑化し、オーディオ信号を拡張し、処理されたオーディオデータを処理ストレージ202に戻す工程を含むオーディオ処理技術を適用する。また別の実施形態によると、フィルタリング/処理モジュール214は予め定義された事象についての情報を格納する参照テーブルを適用して、オーディオ事象の要約において除外されるべき事象(例えば所定周波数での電話の呼び出し音など)を把握しうる。また、更なる実施形態によると、フィルタリング/処理モジュール214はマルチメディア処理装置100によって受信されたビデオコンテンツを上記と同様の方法でフィルタ処理し、平滑化し、変更しうる。例えばフィルタリング/処理モジュール214は生データがよりコンパクトな形式で記憶されるように自動的にこのデータのコントラストやトラッキングを調整し、画像の解像度を低くすることができる。また別の実施形態によると、フィルタリング/処理モジュール214は背景のノイズから発話を区別することを可能にする音声(言語)認知技術を適用しうる。また別の実施形態によると、マルチメディアデータ150に対してアクティビティのない期間中のデータが削除されるようなフィルタ処理が施され、したがって処理されたファイルはアクティビティのある期間のデータのみを含むこととなる。なお、このアクティビティとはデシベルレベル、波形、シーン変化や、その他の所定パラメータによって定義されうる。また別の実施形態によると、フィルタリング/処理モジュール214は一般のフレームグラバー技術を適用してビデオデータから所定のフレームを捕らえることができ、またマルチメディアデータを解析して所定のプロフィールに一致するデータ「事象」だけを他のマルチメディアデータから分離することもできる。
動き検出モジュール216はバス110を介してシステムモジュール200と処理ストレージ202とに結合する。システムモジュール200は、この動き検出モジュール216に関連する入力を受信した場合、ビデオデータにおける動きを検出するようにこの動き検出モジュール216に信号を送る。図3は本発明の一実施形態に基づいてマルチメディア処理装置100が受信するビデオストリームを処理するステップを示す図であって、この処理は部分的にこの動き検出モジュール216によって実行される。図3に示される処理ステップを実行することにより、動き検出モジュール216によってビデオデータから検出された動きはユーザによってマルチメディア処理装置100に供給される既存の要素と比較されうる。一連の処理ステップはまずビデオデータにおけるフレームNが例えばデジタルレコーダなどによって解像度640×480ピクセルで取り込まれルことによって開始する。マルチメディア処理装置100はレコーダに結合されていて、このレコーダから信号線130aを介してフレームのストリームを受信する(302)。ビデオレコーダによって取り込まれたビデオデータのフレームは一定間隔でメモリ104の処理ストレージ202に記憶され、現在の基準フレームをして指定される。個々のビデオフレームが受信されるたびに、例えばカウンタなどに基づいて基準フレームイを現在基準フレームとされるフレームをから当該受信されたフレームに変更すべきか否かを判断する。マルチメディア処理装置100がフレームNを受信すると、システムモジュール200は動き検出モジュール216にフレームNと現在の基準フレームとの差を計算するように指示するコマンドを送る(304)。動き検出モジュール216はフレームNと基準フレームとを取り込み、これら2つのフレーム間の差をピクセルごとにマッピングして差フレームを生成する。そしてこの差は所定の閾値と比較される(306)。ここでこの閾値以下の差はノイズとみなされるが、この閾値以上の差は動きが起きたことを示すとされる。動きが検出された場合この動き検出モジュール216は隣接ピクセルの差を「コンポーネント」にグループ分けすることにより連結コンポーネントを抽出する(308)。よって各連結コンポーネントは寸法サイズ(Σ)及び中心点(x、y)によって特徴付けられうる。そしてこの結果がシステムモジュール200に返信される。次にシステムモジュール200は事象検出モジュール208にこの動き検出が施されたデータから所定の事象を検出するよう指示する。
図2に戻って、事象検出モジュール208はバス110を介してシステムジュール200と処理ストレージ202とに結合される。ある実施形態によると、図3に示されるようにユーザによってバス線130bを介してマルチメディア処理装置100に要素記述のリスト311が供給され、このリストにおける各項目は特定事象についてのサイズや場所などの特徴を記述する(例えばドアの前に人が立つという事象など)。図3の説明に戻ると、事象検出モジュール208はフレームNから抽出された連結コンポーネントを要素記述311と比較する(310)。事象検出モジュール208は例えば検出したコンポーネントと要素記述との間に一定のマッチング閾値を超える比例的相関関係を検出した場合は連結コンポーネントと要素記述との一致を検出したとする(312)。この検出結果はバス110を介してシステムモジュール200に返信される。この検出ステップは、更なる連結コンポーネント314が検出されなくなるまで繰り返される。ある実施形態によると、事象の検出モジュール208は各種既存アルゴリズムや処理プロセスを用いて様々なマルチメディア事象を検出することができる。
図2に戻って、ある実施形態によると、事象検出モジュール208は同業者の間では周知であるオーディオ特性分析/認知技術などを用いてある事象が発生したか否かを判定する。このオーディオ特性分析/認知技術としては、例えばRui Cai, Lie Lu, Hong-Jiang Zhang, Lian-Hong Caiによる“Using Structure Patterns of Temporal and Spectral Feature in Audio Similarity,”(ACM Multimedia 2003, Berkley, CA, 11月2−8日,219-222頁)に記載されるような技術を適用することが可能である。また別の実施例によると、事象検出モジュール208は例えばHull et. alによる米国特許出願10/814,944号(2004年3月30日出願)に記載されるような顔検出アルゴリズムを適用してビデオフレームに特定の人物が現れた場合これを事象として検出することができる。また、ある実施形態によると、象検出モジュール208は参照テーブルにおいてそのプロフィールが記述される事象を検出するように「仕込まれる」ことが可能である。例えば電話がなるという事象のプロフィールは、この音の発生する方向、ピッチ、期間、トーン周波数などに基づく。そして受信されたマルチメディアデータが記述されるプロフィールに近いほど事象検出モジュール208がこのプロフールに対応する事象を正確に検出した確率が高くなる。また、事象検出モジュール208は、例えば適正な呼び出し音と一方的な会話との組み合わせを検出した場合に、電話による対話があったことを検出することができる。また更なる実施形態によると、事象検出モジュール208は、例えば1又は複数人数が閉鎖された空間内に一定の期間の間所在し、オーディオ装置によって2種類以上の発声音が取り込まれるなどいくつかの要素を検出した場合、オフィス内での対談があったと判断することができる。
また、事象検出モジュール208は事象トリガーデータ処理を実行するのに適用されることも可能である。図4は事象トリガーデータ処理ステップの一例を示すフローチャートである。この図によると、まずマルチメディアデータがマルチメディア処理装置100によって受信され(404)、このデータがフィルタ/処理モジュール214によって処理される(408)。事象検出モジュール208は好ましくは所定マルチメディア「事象」及びこれらによってトリガーされる動作の記述やプロフィールを記憶する事象テーブル410を参照して事象検出を行う(412)。そして事象が検出された場合(416)さらに事象テーブル410に基づいてこの事象が所定の動作をトリガーしたか否かの判定が行われる。この判定ステップは事象テーブル410をアクセスするシステムモジュール200及び処理ストレージ202によって実行されうる。ここである動作がトリガーされたと判定された場合、システムモジュール200はモジュール204〜216のなかから適確な1又は複数のモジュールを起動させ、この事象に対応付けられる動作を実行させる。なお、マルチメディア処理装置100は処理ステップの結果、すなわち事象が検出されなかったり、トリガーされた動作がなかったり、該当する動作が既に実行されていた(424)場合などの判定結果とは関係なくデータを受信し(404)、このデータを処理し(408)、このデータに対して事象検出を行う(412)ステップを繰り返す。
ローカライゼーション・モジュール206はバス110によってシステムモジュール200及び処理ストレージ202に結合される。ある実施形態によるとシステムモジュール200は適確な入力を受信すると、ローカライゼーション・モジュール206に対してローカライゼーション処理を行うよう信号を送信する。ある実施形態によると、ローカライゼーション・モジュール206は、上述のようなシステムモジュール200からのコマンド信号に反応するマイクロホンアレイから受信するオーディオデータに基づいてローカライゼーション処理を実行する。このマイクロホンはネットワークを介してこのマルチメディア処理装置100に接続される。ローカライゼーション・モジュール206がこのようにしてオーディオ・ローカライゼーションを実行する間メディア処理装置100はマイクロホンに対して音源の方向に向くようにコマンドを送る。なお、マイクロホンはこのコマンドに応じて方向付けられ、これによってマルチメディア処理装置100に送信されるオーディオデータの品質が改善されうる。ある実施形態によると、2対のマイクロホンが会議室の周囲の所定箇所に配置される。そして各マイクロホンに付属するFIFO(first in first out)バッファーがそれぞれ一定間隔でオーディオサンプルを受信する。このサンプルはリアルタイムで信号線130aを介して処理装置100に送信され、処理ストレージ202にルーチングされる。システムモジュール200はローカライゼーション・モジュール206に対してこのサンプルに基づいてローカライゼーション処理を実行するように指示する。この処理を実行するためにローカライゼーション・モジュール206は音の速さ及びマイクロホン対間の距離に基づいてオーディオ到着の遅延時間を計算する。そしてローカライゼーション・モジュール206はマイクロホン対間の相関性を最大限にするためのオフセット値を計算する。この情報は音源の方向、すなわち空間中で最もエネルギーを発する点を推定するために用いられる。フィルタ/処理モジュール214はこの情報をシステムモジュール200に送信し、ここでこの情報は1又は複数のマイクロホンが音源に向けられるようこれらを機械的に再配置するためのコマンドに変換される。そしてシステムモジュール200はこれらのコマンドを出力系108に送信する。さらに出力系108はこれらのコマンドを信号線130a経由で周辺装置155に該当する各マイクロホンに返信する。なお、この一連のステップは各サンプルについて繰り返される。
また、別の実施形態によると、ローカライゼーション・モジュール206は、視覚センサー、ステレオカメラ、ビデオ検出装置、温度センサーなどのうちのどれか1つ又は複数によって取り込まれたデータに基づいてローカライゼーション処理を実行する。例えばデータ入力に基づいてローカライゼーション処理を実行するためのアルゴリズムとして、Neal Checka, Kevin Wilson, Vibhav Rangarajanらによる“Person Tracking Using Audio-Video Sensor Fusion”(Artificial Intelligence Laboratory of the Massachusetts Institute of Technology of Cambridge, Massachusetts)に記載されるアルゴリズムを適用することが可能である。
インデックス化/マッピング・モジュール210はバス110によってシステムモジュール200及び処理ストレージ202に結合される。ある実施形態によると、システムモジュール200は、適確な入力を受信するとインデックス化/マッピング・モジュール210に対してマルチメディアデータ150を要約ファイル又はインデックスにマッピングするように指示する信号を送る。この指示を実行するためにインデックス化/マッピング・モジュール210はシステムバス110を介してマルチメディアデータ150にアクセスする。このインデックス化/マッピング・モジュール210は様々なデータマッピングプログラムを適用/応用してマルチメディアデータ150を分析し、これを更に分析するために要約ファイルなどにマッピングすることができる。なお、マッピングプログラムとしては、例えばカリフォルニア州のサンノゼを拠点とするAbode Systems社の「Audition」(製品名)や、その他ここにおいて本願に参照により挿入される以下の文献中に記載されるアルゴリズムなどを適用することが可能である。
“Visualizing Multimedia Content on Paper Documents: Key Frame Selection for Video Paper,”Jonathan J. Hull, Berna Erol, Jamey Graham, Dar-Shyang Lee; 7th International Conference on Document Analysis and Recognition, 2003(ビデオからのキーフレーム選択)
“Portable Meeting Recorder,”Dar-Shyang Lee, Berna Erol, Jamey Graham, Jonathan J. Hull, Norihiko Murata; ACM Multimedia Conference, 2002(オーディオ及びビデオからの事象検出)
“Key frame selection to represent a video,”F. Dirfaux; IEEE International Conference on Image Processing 2000(キーフレーム選択)
また別の実施形態によると、インデックス化/マッピング・モジュール210は時間間隔、会議において話す人、シーン切り替え、などのマルチメディアのキューなどを含む様々な手段を用いてマルチメディアデータ150をセグメントに分断し、これら各セグメントの参照となるインデックスを提供する。ある実施形態によると、インデックス化/マッピング・モジュール210は生成されたマッピング又はインデックス情報を記憶するための新たなファイルを作成し、この新たなファイルをシステムバス110によって処理ストレージ202に送信しここに記憶させる。また、ある実施形態によると、インデックス化/マッピング・モジュール210はBerna Erol, Dar-Shyang Lee, Jonathan J. Hullらによる“Multimodal Summarization of Meeting Recordings,”(IEEE International Conference on Media and Expo, Baltimore, MD, 2003年7月)に記載されるアルゴリズムを用いて情報の演算、マッピング、またはインデックス化を実現しうる。また、オーディオのセグメント分割及びオーディオのマッピング技術及びインタフェースについての詳細は“Multimedia Print Driver Dialog Interfaces”と題されるHull et. alによる米国特許出願10/814,944号(2004年3月30日出願)に記載される。
また、ある実施形態によると、インデックス化/マッピング・モジュール210は、マルチメディアデータにおける各セグメントに対応するバーコードなどの識別子を生成することもできる。これを実現するためには例えばイリノイ州エバンストンのBarcode Software Centerによるソフトなどの既存ソフトを適用/応用してマルチメディアデータにおける特定セグメントの場所に対応する読取可能なバーコードを作成することができる。なお、この特定セグメントは例えば電話の呼び出し、会話、または夜間のオフィス訪問者などに対応しうる。
レポート・モジュール204はバス110によってシステムモジュール200及び処理ストレージ202に結合される。システムモジュール200は、適確な入力を受信すると、レポート・モジュール204に対してマルチメディア150に基づくレポートの作成を開始するように指示する信号を送信する。このレポート・モジュール204によって実行される一連の処理ステップは要求されるレポートの種類によって異なる。例えばある実施形態によると、マルチメディア処理装置100は、ビデオペーパーを作成する処理コマンド190をユーザから受信しうる。このビデオペーパーは例えば紙の上に選択キービデオフレーム及びこれに対応するバーコードを提示していて、これによってユーザがこれらフレームによって参照されるビデオデータにおける特定の時点からこのビデオデータを再生できるようにする。なお、レポート・モジュール204はここにおいて参照により本願に挿入される以下の文献に記載されるビデオペーパー技術を用いてレポートを作成することができる。
・“A Paper-based Interface for Video Browsing and Retrieval,”Jamey Graham, Jonathan J. Hull; IEEE International Conference on Multimedia and Expo(ICME), Baltimore, MD; July 6-9, 2003
・米国特許出願整理番号10/001,895“(Video Paper)Paper-based Interface for Multimedia Information”(2001年11月19日出願)
・米国特許出願整理番号10/001,849“(Video Paper)Techniques for Annotating Multimedia Information”(2001年11月19日出願)
・米国特許出願整理番号10/001,893“(Video Paper)Techniques for Generating a Coversheet for paper-based Interface for Multimedia Information”(2001年11月19日出願)
・米国特許出願整理番号10/001,894“(Video Paper)Techniques for Retrieving Multimedia Information Using a Paper-Based Interface”(2001年11月19日出願)
・米国特許出願整理番号10/001,891“(Video Paper)Paper-based Interface for Multimedia Information Stored by Multiple Multimedia Documents”(2001年11月19日出願)
・米国特許出願整理番号10/175,540“(Video Paper)Device for Generating a Multimedia Paper Document”(2002年6月18日出願)
・米国特許出願整理番号10/645,821“(Video Paper)Paper-Based Interface for Specifying Ranges CIP”(2003年8月20日出願)
また、別の実施形態によると、レポート・モジュール204は、マルチメデァイオブジェクトが作成されていくつど、これを既存のドキュメント・テンプレートのプレースホルダに挿入する。このドキュメント・テンプレートは予め生成されると予想されるオブジェクトに対応するプレースホルダを有する。図5はこのような処理を実現するための一連のステップの一例を示す。なお、この処理は部分的にこのレポート・モジュール204によって実行されうる。この処理ではまずユーザが信号線130bを介してマルチメディア処理装置100のプロセッサ106に処理コマンド190を送信する。上述のようにこのコマンド190はマルチメディア処理装置100のグラフィック・ユーザインタフェース、プリントダイアログへの入力、ユーザコマンドを受信するための他のシステムなどから発されるお琴が可能である。このコマンド190はシステムモジュール200によって受信される(504)。このコマンド190はマルチメディア処理装置100に対して未来における特定の時点または未来に起きる特定の事象に反応してデータを取り込み、このデータをマルチメディア・オブジェクトに変換し、これを印刷されるドキュメントに挿入するように指示する。ある実施形態によると、システムモジュール200はユーザの要請に基づいてレポート・モジュール204に対してレポート・テンプレート・ドキュメントを作成するよう指示する。ここではオブジェクト挿入機能及びマイクロソフト(登録商標)ワード・プラグインなどを利用して、レポート・モジュール204はまだ発生していないマルチメディアデータ・オブジェクトのためのプレースホルダを有するテンプレート・ドキュメントを作成することができる。ある実施形態によると、このテンプレート・ドキュメントはマルチメディア処理装置100のプロセッサ106で作成されうる。また、このテンプレート・ドキュメントを作成するタスクはマルチメディア処理装置100と信号線130cを介して通信を確立している処理装置160にオフロードされることも可能である。また、ある実施形態によると、マルチメディア処理装置100の代わりにユーザがマイクロソフト(登録商標)ワードなどを用いてテンプレート・ドキュメントを作成してもよい。レポート・モジュール204はオブジェクト挿入機能を適用して、ファイルに検出されるべき関連事象について記述する非印刷PDL(page description language)コメントなどを挿入することができる。ユーザはPDLコメントが埋め込まれたテンプレート・ドキュメントをシステムバス110経由でマルチメディア処理装置100へ送信する。このドキュメントは所定のデータオブジェクトが作成されてテンプレートにおける所定の場所に挿入されるまで印刷されない。
マルチメディア処理装置100がコマンド190を受信すると(504)、事象検出モジュール208はシステムモジュール200より送信される要求に応じてマルチメディアデータ150をモニタする。事象検出モジュール208はマルチメディアデータ150をスキャンし、ユーザによって指定される特定トリガー事象を検索する。そして該当する事象を検出すると(512)、事象検出モジュール208はシステムバス110を介してシステムモジュール200にマルチメディアデータ150においてこの特定の事象が起きたことを示す信号を送る。続いてシステムモジュール200ハこの事象をマルチメディア・オブジェクトとして取り込む(516)。例えば、マルチメディアデータ150のストリームにおいて「電話による会話」又は「オフィスでの話し合い」が識別される(事象テーブルなどに基づいて)度に、レポート・モジュール204はこの事象をディスクリート・オブジェクトとして処理ストレージ202に記憶し、システムモジュール200に対して該当するオブジェクトが検出され取り込まれたことを示す信号を送信しうる。システムモジュール200からのコマンドに反応するレポート・モジュール204は次にこの取り込まれたオブジェクトを処理ストレージ202に記憶されたレポート・テンプレートに挿入する(520)。レポート・モジュール204は更にこのオブジェクトについてのメタデータ(例えばデータ作成日時など)をドキュメントに挿入する(522)。この時点でシステムモジュール200はこのドキュメントが完成されていて出力される準備が整っているか否かを判定する(524)。例えばこのドキュメントはいくつかのマルチメディア・オブジェクトを収容するためのプレースホルダを有し、これらのプレースホルダすべてにオブジェクトが挿入されるまで完成されたとみなされない場合がありうる。また、別の例ではドキュメントは所定の事象が起きなかった場合でも所定の待ち行列制限時間が経過した場合は完成されたとみなされる場合がありうる。ドキュメントが完成されたとみなされなかった場合、モニタ(508)、検出(512)、取り込み(516)などの処理ステップが繰り返される。例えばテンプレートのプレースホルダのすべてにオブジェクトが挿入されたか、あるいは所定のモニタ期間が経過したことによりドキュメントが完成されたと判定された(524)場合、ドキュメントは出力される(526)。
図2に戻り、アーカイブ・モジュール212はバス110によってシステムモジュール200及び処理ストレージ202に結合される。システムモジュール200ハ、適格な入力を受信すると、アーカイブ・モジュール212に対してマルチメディアデータ150又は処理されたマルチメディアデータ150をアーカイブに記憶するように指示する信号を送信する。このアーカイブはアーカイブ・モジュール212において記憶されるか、あるいはマルチメディア処理装置100におけるその他の場所に記憶されることが可能である。ある実施形態によると、アーカイブ・モジュール212はマルチメディアデータ150を出力系108に出力し、このデータが信号線130dを介してネットワークへ送信され遠隔サーバに記憶されるようにすることも可能である。また、ある実施形態によると、マルチメディアデータ150は処理装置160又はその他の別装置に記憶されうる。
図6は本発明の一実施形態による図1Aのシステムにおいて作成される紙出力の一例を示す図である。作成されたレポートの一例としての「夜間オーディオ・モニタ・レポート」600は、オーディオ状態を示す時間線612を表示する。この特定事例においてはこの時間線によって示されるオーディオ状態はある診療クリニックに配置されたマイクロホンによって検知されるオーディオ状態に該当する。ある実施形態によると、マイクロホンは1つの部屋に配置され、オーディオデータを取り込み、これを無線接続によって図1Aのマルチメディア処理装置100においてストリーミングする。マイクロホンは常に部屋内のオーディオをモニタしているが、図中の時間線612に示されるようにマルチメディア処理装置100は部屋に誰も所在しないため監視に必要がある時間帯に相当する午後5時から午前8時までの間に取り込まれたデータのみを処理するようにプログラムされる。業務時間中は、このマイクロホンは電源が切られるか、あるいはデータフィードをプリンタの一時的記憶バッファーに送信し、一時的記憶バッファーが一杯になり次第順次データが削除されるようにプログラムされることも可能である。ここでは発生する音の生オーディオデータがマイクロホンから送信され、マルチメディア・インタフェース102で受信され、システムバス110を介して処理ストレージ202にルーチングされる。システムモジュール200からのコマンドに対して反応するフィルタ/処理モジュール214は、処理ストレージ202からこのデータをアクセスし、このデータから識別可能である通常音(例えば空調システムの起動音や停止音、コンピュータ・ファンによる背景ノイズなど)の事象をフィルタするなどの処理を施して新たなファイルを作成する。このフィルタされたデータはマルチメディア処理装置100またはその他の装置における保護されたアーカイブに記憶される。
次にシステムモジュール200はシステムバス110を介して事象検出モジュール208に対してこのフィルタされたデータを処理し、所定の事象の発生を検出するように指示する信号を送信する。これに応じて事象検出モジュール208はこのデータをスキャンし、特定の事象に関連付けられる予め識別されている音形式を検索する。この予め識別された音形式は、一定期間において実施されるシステム管理者による一連の音観測に基づいて識別され、処理ストレージ202のデータベースなどに記憶される。データベースにおける各事象のそれぞれには「ドアが開く」、「ドアが閉まる」などの端的な記述が対応付けられる。事象検出モジュール208はこれらの記憶されたプロフィールと受信したデータとを比較して、これら事象のマッチングを検出する。これらの事象は例えば電話の会話の始まりと終わりや、ドアが開いたり閉まったりするなどの事象に相当しうる。また、マルチメディアデータ150におけるこれらの事象の場所を示すインデックスがインデックス化/マッピング・モジュール210によって作成される。システムモジュール200は事象検出モジュール208から例えば電話の会話の始まりと終わりが検出されたという情報を受信する。システムモジュール202はインデックス化/マッピング・モジュール210に対してこの電話の会話の参照用バーコードを作成するよう指示する要求を送信するための論理を有する。
インデックス化/マッピング・モジュール210は、アーカイブにおけるこの電話の会話の場所を示す読取可能バーコードを作成する。このバーコードはこの電話の会話の始まり・終わり及びこのオーディオデータへのリンクを示す。次にシステムモジュール200はレポート・モジュール204に対してレポート600を作成するよう要求する信号を送信する。これに応じてレポート・モジュール204は処理ストレージ202に記憶されるレポート・テンプレートのリポジトリをアクセスし、既にレポート名、その他レイアウトや余白などの詳細が規定されている適切なテンプレートを選択する。そしてレポート・モジュール204はフィルタされた生データを取り込み、レポートファイルにおいてスケーリングされた時間線612にマッピングする。なお、このレポートでは、ユーザが事象の発生を即認識できるように、検出された事象が大きく誇張されて示される。また、レポート・モジュール204は検出された各事象に対応する端的な記述を各事象の隣に挿入し(606)、各事象の起きた時間を示す(604)。また、このレポートでは事象の発生を表すグラフとテキストとを対応付けるために点線が示される。また、レポートの上部にはこのレポートの日付を示す日付印602が付与される。また、アーカイブに記憶される処理済データファイルにおけるこの電話の会話の場所を指すバーコード608が挿入される。これによって後に誰かがこの電話の会話の記録を聞くことを希望した場合、このバーコードを用いてこのデータ箇所にアクセスでき、ほとんどの箇所が沈黙箇所に相当する15時間にも及ぶテープデータにおけるこの電話の会話の場所を手動で探す必要がなくなる。このレポートはすべて処理ストレージ202に記憶される。そしてシステムモジュール200はこのレポートと共にこのレポートの印刷可能コピーを所定の保護Eメールアドレスに自動的に送信するよう指示するコマンドを出力系108に送信する。
なお、同業者には自明であるように、図6はマルチメディアプリンタ又はマルチメディア処理装置100によって作成されうる様々な形式のレポートの一例に過ぎず、これ以外の形式の出力を作成することももちろん可能である。例えば発生した事象の記録だけを示し、何の事象も検出されない時間箇所は省略される簡略化されたレポートを作成することも可能である。また、処理対象とされるデータが光学ディスクに焼かれたビデオデータなどであってもよい。また、テンプレートを適用すると同時にレポート・モジュール204はマルチメディアデータ処理装置100によって読み取られ処理されるデータと共に送信されるPDLコメントに基づいてシステムモジュール200からフォーマット指示を受信することができる。またその他の出力形式での出力がマルチメディアデータ処理装置100によって作成されることも可能である。ある実施形態によると、マルチメディアデータ処理装置100はユーザによるユーザインタフェースを介する入力に応じてオーディオデータおよびビデオデータを書き換え可能CD(非図示)に焼くことができる。このCDは、例えばオーディオ及びデータフィードからの生データの圧縮バージョンと共により高度なレポートを含むことが可能である。
ある実施形態によると、ユーザはマルチメディア処理装置100を用いてある交差点で起きる交通違反及び交通事故などの事象を検出する過程をストリーミングしうる。この場合例えばビデオカメラがこの交差点に設置され、ここからモニタネットワークを介してデータが送信される。このネットワークは例えばブロードバンドワイヤ及びマルチメディア処理装置100への無線接続などから構成されうる。ユーザはマルチメディア処理装置100のユーザインタフェースを介してモニタリングの対象とする事象のプロフィールを入力する。例えばユーザはこの交差点で起きる交通事故のレポートが印刷されるようにしていうることができる。また別の例では、ユーザは赤信号であるにもかかわらず交差点において一定の方向に向いている車の写真が撮られるように設定することができる。そしてユーザは、例えばビデオデータから捉えたスナップショット画像や、72時間の間に起きた赤信号無視らしき事象の発生時点を示す事象ログなど、見たい出力を選択することができる。また、ユーザはインタフェースを用いてデータがどのように記憶されるべきかを示すことができる(例えばデータベースへ記憶するあるいはディスクに焼くなど)。マルチメディア処理装置100はこれらのコマンドを受信し、交差点のビデオカメラから受信したビデオデータのストリームに対してこれらのコマンドを適用する。ある実施形態によると、一定期間において起きる交通違反らしき事象の発生時間が示され、且つこれら各交通違反事象の光景を捉えたスナップショットが挿入された交通違反レポートが毎週作成されうる。この交通違反事象のスナップショットは好ましくは各事象の当事者である車のナンバープレートを写しているスナップショットである。このレポートは作成が完了すると、紙に印刷されマルチメディア処理装置100から出力されうる。
図7は遠隔会議の遂行を容易にし、これを適切に記録するためにマルチメディア処理装置100を適用する実施の一例を示す。この図の例では、オフサイト・ロケーション704で複数人数間の会議が行われる。このオフサイト・ロケーションに相当する部屋の片隅には4チャンネル・オーディオ機能を有するデジタルビデオカメラ706が設置される。また4つのマイクロホンがこの部屋の各所に設置される。そして会議中、このカメラ及びマイクロホンからビデオ及びオーディオデータがリアルタイムで専用接続により信号線702aを介してマルチメディア処理装置100へストリーミングされる。この接続は例えばWebex.comなどのミーティング技術を適用して設定されうる。マルチメディア処理装置100はマルチメディアデータ150を受信し、このオーディオ及びビデオデータフィードを信号線702b経由で、この場合はイーサーネット接続を介してオフィス710にルーチングする。これによってこのオフィス710でこのデータがリアルタイムでネットワーク・ディスプレイにおいて放送されうる。このオフィス710から会議の光景を観察している会議参加者は、例えばこの会議のロケーションに電話してこの会議室704に設置されるスピーカホンを介してしゃべることによりこの会議に参加することができる。また別の例によると、第2ビデオカメラとマイクロホンがオフィス710に設置され、この第2ビデオカメラによって生成されるビデオフィードがマルチメディア処理装置100に送信される。これに応じてマルチメディア処理装置100はこのビデオデータを遠隔会議室704におけるディスプレイにルーチングする。このようにしてマルチメディア処理装置100は会議の遂行を容易にすると同時に、ある実施形態によるとこの会議の部分々々を記録する。例えば会議の参加者が使用するクリッカーによる合図に応じて記録動作を開始/停止することができる。ユーザはこのクリッカーを用いて記録を希望する会議の重要部分を指定することができる。このクリッカーは信号線702a又は702bを介するまた別の接続によってマルチメディア処理装置100に接続されうる。また、米国特許出願番号10/754,907“Generating and Displaying Level-Of-Interest Values”(2004年1月9日出願)に記載されるミーティング参加者の関心を示し、関心情報に基づき事象を検出する技術、方法、及び装置を適用することも可能である。また別の実施形態によると、会議のすべてが自動的に記録され、会議アーカイブ708として記憶され、一定期間中ネットワーク712またはユーザと通信可能なその他のネットワークからアクセス可能に設定されうる。ここでこの会議アーカイブ708が指定された期間内において誰にもアクセスされず、またこれを保存するような指示が発されなかった場合この期間の経過後アーカイブ708は削除される。ある実施形態によると、会議の始めに会議の参加者及び会議の議題が示される。会議のインデックスは例えば日付、時間、長さ、及びビデオの最初2分へのリンクを含み、ユーザはこれによりこの会議の内容及び時期を容易に思い出すことができる。
上述のように、本発明の各種実施形態によって生のマルチメディアデータを扱い、このデータを紙ベース又はその他既存のワークフローに導入できる有用な出力に変換する処理が容易にされる。本発明のある実施形態によると、ユーザはマルチメディアデータにおける事象を定義し、特定することができる。ユーザの記述に基づきマルチメディア処理装置100は受信するデータからこれらの事象を検出し、これらの事象によってトリガーされる所定の動作を実行することができる。
図8は事象とこれによってトリガーされる動作の対応関係を示す事象テーブルの一例を示す。図示されるように、この事象テーブル800はマルチメディアにおける「事象」の記述を記憶する。この記述は好ましくはマルチメディアデータ・メトリックによって表現され、例えばビデオフレームにおける画像の寸法サイズ(Σ)及び中心位置(x、y)などによって示されうる。しかしこれ以外にもマルチメディアデータにおける事象を識別するための様々な形式を適用することが可能である。なお、事象テーブルはデータベース、プログラム言語での一連の命令文、XMLドキュメント、単純なテーブル又は一連のデータストリングという形をとる単純なアルゴリズムなどに相当しうる。図8の事象テーブル800の例において事象が検出された場合、例えばcgi(common gateway interface)スクリプトを適用してプリントドライバ又はウェブブラウザ・インタフェースにおける専用目的アプリケーションによって事象カウンタが更新されうる。各事象は所定の動作に対応付けられ、この動作は例えば所定の数だけ事象が発生することによりトリガーされうる。
ある実施形態によると、動き検出機能を有するプリンタは、特定の用紙トレーから用紙が移されるたびに特定周波数のリングトーンを鳴らすようにプログラムされることが可能である。図8に示されるようにユーザはこの用紙トレーのトーンの響きをその特定周波数及び時間の長さなどに基づいて特定することができる。よって例えばドキュメントがトレーから取り出された回数を示すレポートが毎日作成されオフィス管理者などに送信されうる。なお、ユーザはレポートが送信されるたびにカウンタがリセットされるようにプログラムすることができる。また、図8のテーブルで特定されるまた別の特定事象として、オフィスでのディスカッションが示される。この事象を検出するためには上述のアルゴリズムを適用することが可能である。そして事象が検出されるたびにこのディスカッションを記録し、特定のディスカッションサーバーのアーカイブに記憶するという動作がトリガーされるかあるいは起動される。図8に示される3つ目の事象は電話の呼び出し音に相当する。この例では電話の呼び出し音が検出されるたびに、もう1つの事象の検出、すなわち発声音を検出する動作がトリガーされる。図8のテーブルに示されるように、さらに発声音が検出されると、この電話の会話が終わるまでこの発声音を記録する動作がトリガーされる。なお、この図に示される上記3つの例は事象テーブルにて特定されうる様々な事象、動作トリガー、動作の組み合わせなどのほんの一例に過ぎずこれ以外の例も数多く構想されうる。
図10はマルチメディア処理装置100がオーディオ及びビデオデータのモニタリングに基づいてレポートを作成する際に適用するレポート・テンプレート・ドキュメントの一例を示す。図9はテンプレートにマルチメディア・オブジェクトが挿入されることにより完成したレポートの一例を示す。図10に示されるレポート・テンプレート・ドキュメント1000はオーディオ及びビデオのモニタ事象を挿入するための3つのセクション1012を有する。またこのレポートの題名「増分オーディオ+ビデオ・モニタリング・レポート」1002がこのテンプレート・ドキュメント1000の上部に設けられる。このテンプレート/ドキュメント100の各セクション1012はそれぞれ日付及び時間1006、事象記述1008、及び特定の事象の場合に付与されるバーコード識別子1010のプレースホルダを有する。さらに各セクション1012にはそれぞれの事象に対応する画像1004のプレースホルダが当該セクション1012の左側に設けられる。レポートはレポートされるべき事象、その記述、及びをこの事象が検出された場合この事象に基づいて実行されるべき動作などを示すテーブルに基づいて作成される。この例では、特定される事象は、用紙トレーからドキュメントが取り出される事象や、フィーダーに用紙を供給する事象、プリンタ周囲での会話などプリンタ付近で起きる事象に相当する。
マルチメディア処理装置100はオーディオ及びビデオデータフィードを受信し、事象検出モジュール208は受信したデータから特定された各事象を検索する。そしてトレーからドキュメントを取り出すという第1事象が起きると、この事象の日付及び時間906aと、参照テーブルに示されるこの事象の記述908aとが第1レポートセクション1012aに挿入される。なお、この事象に対応付けられる動作として、この事象を実行した者を識別する動作が示される。よってマルチメディア処理装置100のフィルタ/処理モジュール214は該当するビデオフィードから画像を取り込み、事象検出モジュール208はアーカイブに記憶される顔のデータベースのなかからこのビデオフィードに示される顔に一致するものを検索する顔認識分析を実行する。そしてこのフィードがある従業員の顔と一致すると判定された場合、あらかじめ記憶されているこの従業員の写真を取り出す。続いてレポート・モジュール204はこの識別写真をテンプレート・ドキュメントのプレースホルダ904aに挿入する。また次の第2セクション912bの出力を生成する際にも、上述同様の事象検出、この事象に関するメタデータの挿入、ビデオデータからの顔認識、及び識別された従業員のストック写真の挿入からなる一連の処理ステップが繰り返される。これに対し、第3セクション912cに示される事象は上記の事象とは若干異なる。すなわちここでは二人の従業員の間の会話に相当する事象を示す。この場合、事象検出モジュール208による事象の検出によりこの会話を記録する動作がトリガーされ、また、インデックス化/マッピング・モジュール210によりこの事象に対応するバーコード・インデックスが作成されて第3セクションの912cに挿入される(910)。また、上記の2つのセクションの例のようにストック写真を挿入する代わりにレポート・モジュール204はフィルタ/処理モジュール214によってビデオフィードから捉えられたフレーム904cを挿入する。このようにして完成されたレポート900はプリンタに送信され出力されうる。
なお上記実施形態は本発明を例示によって説明するために挙げられているのであって、本発明の範囲を限定する要素とはみなされない。例えば上記開示される機能及びこれらの機能を実現するためのハード及びソフトが一般のプリンタに付属されることが可能である。このように既存のプリンタネットワークに対してマルチメディア・モニタリング機能及び処理機能を加えるような変更を行うことで侵害を最小限に抑えたモニタリングネットワークを最小限のコストで実現すことが可能である。なお、同業者には自明であるように、本発明の範囲を逸脱することなく本願で開示される実施形態からさまざまな変形や変更を構想することが可能である。よって本発明の範囲は発明の好適な実施形態の説明によって限定されることはなく、むしろ本願における発明の請求の範囲によってのみ限定されうる。
なお、本願は、米国仮特許出願整理番号60/506,303“Printer Including One or More Specialized Hardware Devices”(2003年9月25日出願)及び米国特許仮出願整理番号60/506,302“Printer Including Interface and Specialized Information Processing Capabilities”(2003年9月25日出願)に基づく出願であってこれら米国出願による優先権を主張するとともにここにおいてこれら米国特許出願の内容を参照により本願に挿入する。
本発明の一実施形態によるオーディオ/ビデオ・ローカライゼーション機能を有するプリンタの構成を示すブロック図である。 本発明の好適な実施例によるオーディオ/ビデオ・ローカライゼーション機能を有するプリンタの構成を示すブロック図である。 図1Aのオーディオ/ビデオ・ローカライゼーション機能を有するプリンタのメモリの構成を示すブロック図である。 本発明の一実施形態によるオーディオ/ビデオ・ローカライゼーション機能を有するプリンタの動作フローを示す図である。 本発明の一実施形態による事象によってトリガーされるデータ処理動作の一例を示す図である。 本発明の一実施形態によるマルチメディア・オブジェクトを含むレポートを作成する処理フローを示す図である。 本発明の一実施形態によるオーディオ/ビデオ・ローカライゼーション機能を有するプリンタの出力の一例を示す図である。 本発明の一実施形態による遠隔会議を用意に遂行させることを目的にオーディオ/ビデオ・ローカライゼーション機能を有するプリンタを適用する例を示す図である。 本発明の実施形態による事象テーブルの一例を示す図である。 本発明の実施形態によるオーディオ/ビデオ・ローカライゼーション機能を有するプリンタによって出力されるマルチメディア・オブジェクトを含むレポートの一例を示す図である。 図9の出力を作成する際に用いられるテンプレートの一例を示す図である。
符号の説明
100 マルチメディア処理装置
102 マルチメディア・インタフェース
104 メモリ
106 プロセッサ
108 出力系
110 バス
150 マルチメディアデータ
160 処理装置
170 紙ドキュメント
180 電子データ
190 処理コマンド
200 システムモジュール
202 処理ストレージ
204 レポート・モジュール
206 ローカライゼーション・モジュール
208 事象検出モジュール
210 インデックス化/マッピング・モジュール
212 アーカイブ・モジュール
214 フィルタ/処理モジュール
216 動き検出モジュール

Claims (50)

  1. ドキュメントを出力する機能を有するマルチメディア処理装置においてマルチメディアデータを受信し、
    前記マルチメディア処理装置において前記マルチメディアデータを処理し、
    前記処理されたマルチメディアデータを出力するステップを含むことを特徴とする方法。
  2. 前記マルチメディアデータはオーディオデータ又はビデオデータに相当することを特徴とする請求項1記載の方法。
  3. 前記マルチメディアデータはマルチメディアデータストリームに相当することを特徴とする請求項1記載の方法。
  4. 前記マルチメディアデータはネットワークから受信されることを特徴とする請求項1記載の方法。
  5. 前記マルチメディアデータは記憶装置から受信されることを特徴とする請求項1記載の方法。
  6. 前記マルチメディアデータを処理するステップは、更に前記マルチメディアデータにおいて予め規定されたマルチメディア事象を識別するステップを含むことを特徴とする請求項1記載の方法。
  7. 前記予め規定されたマルチメディア事象が識別された場合、所定の動作を実行するステップを更に含むことを特徴とする請求項6記載の方法。
  8. 前記予め規定されたマルチメディア事象が識別された場合、事象テーブルにおいて前記マルチメディア事象に対応付けられる動作を実行するステップを更に含むことを特徴とする請求項6記載の方法。
  9. 前記マルチメディアデータをアナログ形式で受信し、
    前記マルチメディアデータをアナログ形式からデジタル形式に変換するステップを更に有することを特徴とする請求項1記載の方法。
  10. 前記処理されたマルチメディアデータを出力するステップは前記処理されたマルチメディアデータをアーカイブファイルに書き込むことによって実行されることを特徴とする請求項1記載の方法。
  11. 前記処理されたマルチメディアデータは前記マルチメディア処理装置によって受信されたマルチメディアデータの表示を構成することを特徴とする請求項1記載の方法。
  12. 前記処理されたマルチメディアデータを出力するステップは前記マルチメディアデータの一部をビデオペーパーとして出力するステップを含むことを特徴とする請求項1記載の方法。
  13. 前記処理されたマルチメディアデータを出力するステップは前記マルチメディアデータの一部を紙ドキュメントとして出力するステップを含むことを特徴とする請求項1記載の方法。
  14. 前記処理されたマルチメディアデータを出力するステップは前記マルチメディアデータの一部をサーバーに記憶し、前記処理されたマルチメディアデータが前記サーバーからアクセスされ表示されうるようにするステップを含むことを特徴とする請求項1記載の方法。
  15. 前記マルチメディアデータはビデオデータに相当し、前記マルチメディアデータを処理するステップは前記ビデオデータからビデオフレームを取り込み、前記取り込まれたビデオフレームをファイルに記憶するステップを含むことを特徴とする請求項1記載の方法。
  16. 前記処理されたマルチメディアデータを出力するステップは、前記処理されたマルチメディアデータを記憶媒体に記憶し、前記処理されたマルチメディアデータをインデックス化するステップを含むことを特徴とする請求項1記載の方法。
  17. 前記マルチメディアデータはオーディオデータに相当し、
    前記オーディオデータはテキストとして記録され、
    前記処理されたマルチメディアデータを出力するステップは前記テキストを出力するステップを構成することを特徴とする請求項1記載の方法。
  18. データを取り込む方法であって、
    周辺機器によって取り込まれたマルチメディアデータをマルチメディアデータ処理装置が受信し、
    前記マルチメディアデータを処理して制御信号を生成し、
    前記制御信号を前記周辺機器に送信するステップを含むことを特徴とする方法。
  19. 前記マルチメディアを処理するステップは、ローカライゼーションを行うステップを含み、前記制御信号は前記周辺機器が取り込むデータの品質を改善するために前記周辺機器を方向付けるための信号に相当することを特徴とする請求項18記載の方法。
  20. 前記マルチメディアデータを処理するステップは、オーディオ・ローカライゼーションを行うステップを含み、前記制御信号は少なくとも1つのマイクロホンを方向付けることを特徴とする請求項19記載の方法。
  21. 前記マルチメディアデータを処理するステップは、ビデオ・ローカライゼーションを行うステップを含み、前記制御信号は少なくとも1つのビデオ取り込み装置を方向付けることを特徴とする請求項19記載の方法。
  22. マルチメディア処理装置においてマルチメディアデータを処理し且つ事象の発生に応じて動作を実行するようなコマンドを受信し、
    マルチメディアデータを受信し、
    前記マルチメディアデータにおいて前記事象を検出し、
    前記事象を検出するのに応じて前記動作を実行するステップを含むことを特徴とする方法。
  23. 前記コマンドはページ記述言語によるコマンドに相当することを特徴とする請求項22記載の方法。
  24. 前記コマンドはウェブベースのユーザインタフェースを介して前記マルチメディア処理装置に送信されることを特徴とする請求項22記載の方法。
  25. 前記コマンドはマルチメディア・オブジェクトを挿入するためのプレースホルダを有するテンプレートを含むことを特徴とする請求項22記載の方法。
  26. 前記事象を検出するステップは、前記事象のプロフィールを受信したマルチメディアデータと比較するステップを含むことを特徴とする請求項22記載の方法。
  27. 前記動作は警告を示す動作に相当することを特徴とする請求項22記載の方法。
  28. 前記動作は前記マルチメディアデータの一部を含むドキュメントを前記マルチメディア処理装置によって印刷する動作に相当することを特徴とする請求項22記載の方法。
  29. 前記印刷するステップは、前記マルチメディアデータに対応するメタデータを印刷するステップを含むことを特徴とする請求項28記載の方法。
  30. 前記動作は前記マルチメディア処理装置によって受信されたマルチメディアデータを表す波形を出力する動作に相当することを特徴とする請求項22記載の方法。
  31. 前記動作は受信したマルチメディアデータを記憶する動作に相当することを特徴とする請求項22記載の方法。
  32. ドキュメントを出力する機能を有するマルチメディア処理装置においてマルチメディアデータを受信し、
    前記マルチメディア処理装置において前記マルチメディアデータを処理し、
    前記処理されたマルチメディアデータを後にアクセスできるように前記マルチメディア処理装置に記憶するステップを含むことを特徴とする方法。
  33. マルチメディア処理装置においてマルチメディアデータを受信し、
    前記マルチメディア処理装置において前記マルチメディアデータを処理し、
    前記処理されたマルチメディアデータを前記マルチメディア処理装置のインタフェースを介して出力するステップを含み、
    前記マルチメディア処理装置は前記処理されたマルチメディアデータを紙ベース形式及び電子形式で出力するように構成されることを特徴とする方法。
  34. 前記処理されたマルチメディアデータを出力するステップは、前記処理されたマルチメディアデータを記憶媒体に記憶し、前記処理されデータをインデックス化す留守轍鮒を含むことを特徴とする請求項33記載の方法。
  35. 前記マルチメディア処理装置において前記マルチメディアデータを処理し且つマルチメディア事象に応じて動作を実行するようなコマンドを受信し、
    前記マルチメディアデータから前記マルチメディア事象を検出し、
    前記マルチメディア事象の検出に応じて前記コマンドを実行するステップを更に含むことを特徴とする請求項33記載の方法。
  36. 前記マルチメディア処理装置において前記コマンドを受信するステップは、複数の事象と、各事象に対応する動作とを格納する事象テーブルを受信するステップを含むことを特徴とする請求項35記載の方法。
  37. 前記処理されたマルチメディアデータをサーバーに出力するステップを含み、前記サーバーから前記処理されたマルチメディアデータをアクセスできるようにすることを特徴する請求項33記載の方法。
  38. 前記処理されたマルチメディアデータは前記マルチメディア処理装置によって受信されたマルチメディアデータの一部からなることを特徴とする請求項33記載の方法。
  39. 前記マルチメディアデータはマルチメディアデータ・ストリームに相当することを特徴とする請求項26記載の方法。
  40. 前記マルチメディアデータはオーディオデータ又はビデオデータに相当することを特徴とする請求項26記載の方法。
  41. プリンタ、
    マルチメディアデータを受信するインタフェース、
    前記インタフェース及び前記プリンタに結合され、前記インタフェースによって受信されたマルチメディアデータを処理するプロセッサ、及び
    前記プロセッサに結合され、処理されたマルチメディアデータを作成された後にアクセスできるように前記処理されたマルチメディアデータを記憶するメモリから構成されることを特徴とする印刷システム。
  42. 前記マルチメディアデータを出力するための出力系を更に有することを特徴とする請求項41記載の印刷システム。
  43. マルチメディアデータを受信するためのインタフェース、
    前記インタフェースに結合され、マルチメディアデータを処理するためのプロセッサ、
    前記プロセッサに結合され、前記プロセッサによって処理されたマルチメディアデータを出力するための出力系で、複数の形式でデータを出力することができるような出力系から構成されることを特徴とするシステム。
  44. 前記出力系は処理されたマルチメディアデータを紙ドキュメント又は電子データに出力するよう構成されることを特徴する請求項43記載のシステム。
  45. 前記出力系は処理されたマルチメディアデータを紙ドキュメント及び電子データに出力するよう構成されることを特徴する請求項43記載のシステム。
  46. 前記プロセッサに結合され、前記マルチメディアデータのコンテンツを第2ファイルにマッピングするインデックス化/マッピング・モジュールを更に有することを特徴とする請求項43記載のシステム。
  47. 前記プロセッサに結合され、処理されたマルチメディアデータを後にアクセスできるように記憶するアーカイブ・モジュールを更に有することを特徴とする請求項43記載のシステム。
  48. 前記プロセッサに結合され、周辺機器から取り込まれるマルチメディアデータの品質を改善するために前記周辺機器に対して送られる位置づけコマンドを生成するローカライゼーション・モジュールを更に有することを特徴とする請求項43記載のシステム。
  49. 前記プロセッサに結合され、マルチメディア事象が発生したか否かを判断する事象検出モジュールを更に有することを特徴とする請求項43記載のシステム。
  50. 前記事象検出モジュールは事象テーブルを用いてマルチメディア事象が発生したか及び前記事象に動作が対応付けられているかを判断することを特徴とする請求項49記載のシステム。
JP2004278347A 2003-09-25 2004-09-24 オーディオ/ビデオ・ローカライゼーション機能を有するプリンタ Pending JP2005100413A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US50630203P 2003-09-25 2003-09-25
US50630303P 2003-09-25 2003-09-25
US10/813,946 US7415670B2 (en) 2001-11-19 2004-03-30 Printer with audio/video localization

Publications (2)

Publication Number Publication Date
JP2005100413A true JP2005100413A (ja) 2005-04-14
JP2005100413A5 JP2005100413A5 (ja) 2007-11-08

Family

ID=34468356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004278347A Pending JP2005100413A (ja) 2003-09-25 2004-09-24 オーディオ/ビデオ・ローカライゼーション機能を有するプリンタ

Country Status (1)

Country Link
JP (1) JP2005100413A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002344636A (ja) * 2001-05-14 2002-11-29 Fujitsu I-Network Systems Ltd 音声会議システムにおける議事録自動作成方式
JP2003005790A (ja) * 2001-06-25 2003-01-08 Takayoshi Yamamoto 複合音声データの音声分離方法、発言者特定方法、複合音声データの音声分離装置、発言者特定装置、コンピュータプログラム、及び、記録媒体
JP2003177776A (ja) * 2001-12-12 2003-06-27 Seiko Instruments Inc 議事録記録システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002344636A (ja) * 2001-05-14 2002-11-29 Fujitsu I-Network Systems Ltd 音声会議システムにおける議事録自動作成方式
JP2003005790A (ja) * 2001-06-25 2003-01-08 Takayoshi Yamamoto 複合音声データの音声分離方法、発言者特定方法、複合音声データの音声分離装置、発言者特定装置、コンピュータプログラム、及び、記録媒体
JP2003177776A (ja) * 2001-12-12 2003-06-27 Seiko Instruments Inc 議事録記録システム

Similar Documents

Publication Publication Date Title
US7415670B2 (en) Printer with audio/video localization
US7864352B2 (en) Printer with multimedia server
KR100887696B1 (ko) 정보 캡처 및 기록 시스템
US7508535B2 (en) Stand alone multimedia printer with user interface for allocating processing
US7528976B2 (en) Stand alone printer with hardware/software interfaces for sharing multimedia processing
US7747655B2 (en) Printable representations for time-based media
US7831598B2 (en) Data recording and reproducing apparatus and method of generating metadata
EP1467288B1 (en) Translation of slides in a multimedia presentation file
CN100572083C (zh) 带有用于多媒体设备的硬件和软件接口的打印机
US7698646B2 (en) Techniques for accessing information captured during a presentation using a paper document handout for the presentation
US20040181747A1 (en) Multimedia print driver dialog interfaces
US20050071746A1 (en) Networked printer with hardware and software interfaces for peripheral devices
US20070041666A1 (en) Information processing system and information processing method
US20080106614A1 (en) Imaging Device and Imaging System
JP2005341015A (ja) 議事録作成支援機能を有するテレビ会議システム
JP2005096457A (ja) 周辺装置のためのハードウェア及びソフトウェアインタフェースを備えるプリンタ
EP1526442B1 (en) Printer driver user interface for multimedia data
JP2009042984A (ja) 画像処理システム、データ処理方法、記憶媒体、プログラム
JP2005111987A (ja) プリンタ及びネットワークプリンタのためのユーザインタフェース
JP2005100413A (ja) オーディオ/ビデオ・ローカライゼーション機能を有するプリンタ
JP2019135609A (ja) 文字入力支援システム、文字入力支援制御装置、文字入力支援プログラム
JP2005100415A (ja) マルチメディア印刷ドライバダイアログインタフェース
EP1518677A2 (en) Printing system adapted for multimedia output
JP2020119444A (ja) 文字入力支援システム、文字入力支援制御装置、文字入力支援制御方法、文字入力支援プログラム
CN111816183A (zh) 基于音视频录制的语音识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070920

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100831

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110322