JP2004080750A - ホワイトボードおよび音声のキャプチャのためのシステムおよび方法 - Google Patents

ホワイトボードおよび音声のキャプチャのためのシステムおよび方法 Download PDF

Info

Publication number
JP2004080750A
JP2004080750A JP2003175464A JP2003175464A JP2004080750A JP 2004080750 A JP2004080750 A JP 2004080750A JP 2003175464 A JP2003175464 A JP 2003175464A JP 2003175464 A JP2003175464 A JP 2003175464A JP 2004080750 A JP2004080750 A JP 2004080750A
Authority
JP
Japan
Prior art keywords
image
whiteboard
cell
color
stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003175464A
Other languages
English (en)
Other versions
JP2004080750A5 (ja
JP4499380B2 (ja
Inventor
Zhengyou Zhang
ツェンユー ツァン
Anoop Gupta
アヌープ グプタ
Ross Cutler
ロス カトラー
Zicheng Liu
ジチェン リウ
Li-Wei He
リ−ウェイ ヘ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2004080750A publication Critical patent/JP2004080750A/ja
Publication of JP2004080750A5 publication Critical patent/JP2004080750A5/ja
Application granted granted Critical
Publication of JP4499380B2 publication Critical patent/JP4499380B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/109Time management, e.g. calendars, reminders, meetings or time accounting
    • G06Q10/1093Calendar-based scheduling for persons or groups
    • G06Q10/1095Meeting or appointment
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • User Interface Of Digital Computer (AREA)
  • Drawing Aids And Blackboards (AREA)

Abstract

【課題】デジタルカメラおよびマイクロホンを使用して会議のホワイトボードの内容と音声信号の両方をキャプチャするシステムを提供する。
【解決手段】本システムは、任意の既存のホワイトボードに後付けすることができる。本システムは、キャプチャされたスナップショットのシーケンスを解析することにより、ホワイトボード上のペンストロークのタイムスタンプを計算する。また、本システムは、各回の消去前のホワイトボード上に書き込まれたすべての内容を代表する1組のキーフレームを自動的に生成することも行う。ホワイトボードの内容は、音声会議を効率的にブラウズするためのビジュアル式インデックスの役割をする。本システムは、ホワイトボードの内容をキャプチャするだけでなく、ユーザが、キャプチャされた会議の内容を効率的かつセキュアに閲覧し、管理するのにも役立つ。
【選択図】    図5

Description

【0001】
【発明の属する技術分野】
本発明は、会議を記録するためのシステムおよび方法を対象とする。より詳細には、本発明は、会議のホワイトボードの内容と音声をともにキャプチャするためのシステムおよび方法を対象とする。
【0002】
【従来の技術】
会議は、多くの勤労者の労働時間の大きな部分を成している。会議で費やされる時間をより効率的に使用することにより、生産性が大幅に向上することになる。
【0003】
多くの会議のシナリオは、ブレーンストーミング(brainstorming)セッション、講演、プロジェクト計画会議、特許情報公開等のために頻繁にホワイトボードを使用する。ボード上に書かれたものをノートに取り、コピーすることが、しばしば、この会議中の多くの参加者の積極的な貢献および関与の妨げとなる。この結果、何らかの自動化された仕方でホワイトボードの内容をキャプチャしようとするいくつかの試みがなされてきた。
【0004】
ホワイトボードの内容を自動的にキャプチャするいくつかの技術が開発されている。最早期のものの1つである、ホワイトボード複写機は、組み込まれた複写機を備えた特殊なホワイトボードである。ボタンのクリックで、ホワイトボードの内容が走査され、印刷される。ホワイトボードの内容は、紙に印刷されると、複写する、ファックス送信する、ファイルキャビネットに収納する、または走査してデジタル形式にすることができる。
【0005】
より新しい技術は、最初からデジタル形式でホワイトボードの内容をキャプチャしようとする。この技術は、2つのカテゴリに入る。すなわち、ホワイトボードのイメージをキャプチャする技術、およびペンの位置を追跡し、その位置からホワイトボードの内容を推測する技術である。
【0006】
第1のカテゴリのデバイスは、ホワイトボードのイメージを直接にキャプチャする。ナショナルテレビジョンシステムコミティ(National Television SystemCommittee)(NTSC)解像度ビデオカメラが、しばしば、廉価であるために使用される。このカメラは、普通、通常の会議室サイズのホワイトボード上に書かれたものを鮮明にキャプチャするのに十分な解像度を有していないため、いくつかの映像フレームを一緒につなぎ合わせて単一のホワイトボードイメージを生成しなければならない。第1のカテゴリの別のデバイスは、デジタルスチールカメラ(still camera)である。高解像度のデジタルカメラがより安価になるにつれ、ボードのスナップショットをデジタルカメラで撮ることが一般的な選択になっている。
【0007】
第2のカテゴリのデバイスは、高い頻度でホワイトボード上に書き込むのに使用されるペンの位置を追跡し、ペン座標の履歴からホワイトボードの内容を推測する。ときとして、このデバイスは、従来のホワイトボードの側部に取り付けられた付加デバイスを含み、ドライインク(dry−ink)ペンとイレーザ(eraser)のための特殊なケースを使用する。それぞれのペンが、ボードに押しつけられると超音波パルスを発する。付加デバイスにおける2つのレシーバが、音声パルスの到着時刻の差を使用してペン座標を三角法で測定する。ペン座標の履歴がキャプチャされるので、任意の所与の時点におけるホワイトボード上の内容を後に再構成することができる。このタイプのホワイトボード記録のユーザは、映画のようにホワイトボードの内容を再生することができる。内容は、ベクトル形式でキャプチャされるため、低帯域幅および小さいストーレッジの要件で伝送し、アーカイブする(archive)ことができる。
【0008】
また、電子ホワイトボードは、ペン追跡技術も使用する。電子ホワイトボードは、ホワイトボードを対話型デバイスにすることで、前述した付加デバイスを使用するシステムより一歩前進している。ユーザは、コンピュータによって追跡される特殊なスタイラス(stylus)を使用してモニタ上に書き込む。コンピュータが、スタイラスがスクリーンに触れたところであればどこでも、スクリーン上にストローク(stroke)を、あたかもインクがスタイラスによって付着させられたかのようにレンダリングする。ストロークは、コンピュータによって生成されたものであるため、編集すること、引き直す(re−flow)こと、および動画化することが可能である。また、ユーザは、コンピュータにジェスチャコマンドを発行し、同じスクリーン上に他のコンピュータアプリケーションを示すこともできる。
【0009】
ただし、電子ホワイトボードは、現在、高価であり、サイズが小さい(電子ホワイトボードのサイズが、対角線長で6フィート(1メートル83センチメートル)を超えることはめったにない)ため、設置ベースがまだ限られている。さらに、ペン追跡デバイスを備えたシステムは、次の欠点を有する。すなわち、1)システムがオンになっていない、またはユーザが、特殊ペンを使用せずに書き込んだ場合、内容をデバイスが回復することができない。2)多くの人々は、ホワイトボード上の小さい誤りを訂正するのに、特殊イレーザではなく、自分の指を使うことを好む。この、よくある行動によりキャプチャされた内容には余分なストロークが現れることになる。3)人々が、特殊なドライインクペンアダプタを使用しなければならず、これにより、一部のデバイスに関して、ペンがより太く、押さえづらくなる。4)ペン追跡の不正確さにより、ときとして、隣接したペンストロークの位置ずれ(mis−registration)が生じる。
【0010】
ホワイトボードキャプチャ方法に関して前述した努力の他に、特に講演および会議に関して、マルチメディア体験のキャプチャ、統合、およびアクセスに関して大量の研究がなされている。手書きのノート、ホワイトボードの内容、スライド、または手書きの注釈を使用して、容易なアクセスのために記録された映像および音声にインデックスを付ける技術およびシステムが開発されている。
【0011】
例えば、Classroom2000プロジェクトと呼ばれるプロジェクトで、Abowd他が、電子ホワイトボードを使用してインクストロークにタイムスタンプを付けて、見る人(学生)が、そのインクストロークを記録されている映像および音声に対するインデックスとして使用することができるようにしている。キーフレーム(ページと呼ばれる)が、電子ホワイトボードによって提供された消去イベントに基づいて計算されている。ただし、Classroom2000プロジェクトは、電子ホワイトボードを必要とした。電子ホワイトボードを使用すると、エンドユーザの視点から多くの欠点が存在する。第1に、ほとんどのオフィスおよび会議室には、電子ホワイトボードが設置されていない。第2に、人々は、電子ホワイトボードより、通常のホワイトボードを使用する方がはるかに自然であると感じることが示されている。第3に、カメラを使用してキャプチャされたイメージの方が、誰が書込みを行い、どのトピックが議論されていたか(通常、手による指し示しにより)などの、はるかに多くのコンテキスト情報を提供する。以上の欠点に加え、電子ホワイトボードは、高価である可能性があり、したがって、容易に入手することができない。
【0012】
【発明が解決しようとする課題】
本発明は、ホワイトボードの内容および関連する音声をキャプチャするためのシステムにおける前述した限界を克服するシステムおよびプロセスを対象とする。
【0013】
【課題を解決するための手段】
本ホワイトボードキャプチャシステムは、キャプチャされたイメージに対して解析を行うことによってペンストロークのタイムスタンプ、およびキーフレームを計算することで、ホワイトボードのイメージを直接にキャプチャする前述したシステムとは区別される。キーフレームイメージは、ホワイトボード上の重要な内容のすべてを含み、記録の要約の役割をする。キーフレームイメージは、他のドキュメントにカットアンドペースト(cut and paste)すること、またはメモとして印刷することができる。タイムスタンプおよびキーフレームは、記録された音声に対する効果的なインデックスである。さらに、本ホワイトボードキャプチャシステムの発明は、一部の他のホワイトボードキャプチャシステムのように電子ホワイトボードではなく、通常のホワイトボードを使用する。したがって、このシステムは、変更することなしに任意の既存のホワイトボードで使用することができる。
【0014】
本ホワイトボードキャプチャシステムは、非電子式のワイトボード上に書き込まれた内容のイメージのシーケンスをカメラを使用してキャプチャする。本ホワイトボードキャプチャシステムは、会議の音声信号を同時に記録する。記録が完了すると、イメージシーケンスが解析されて、ホワイトボード上に書き込まれた内容の重要なポイントを要約するキーフレームが分離される。音声記録は、記録された音声とイメージシーケンスの両方に関連付けられたタイムスタンプでキーフレーム上でペンストロークに相関させられる。このタイムスタンプは、イメージ解析を介して計算される。
【0015】
キーフレームを獲得するための一般的な解析プロセスには、イメージのシーケンスの中のすべてのイメージの中でホワイトボードビューを修正することが関与する。また、ホワイトボード背景色も抽出され、イメージのシーケンスの各イメージが、セルに分割される。時間を経て同一であるセルイメージが、後により詳細に説明するとおり、一緒にクラスタ化される。次に、各セルイメージが、ストローク、前景オブジェクト、またはホワイトボードセルとして分類される。次に、この分類結果を使用してキーフレームイメージが抽出される。セルイメージは、キーフレーム抽出に先立って空間的および時間的にフィルタにかけて分類結果を精密にすることができる。さらに、キーフレームイメージは、抽出されると、カラーバランス処理(color balance)を行ってイメージ品質を向上させることができる。
【0016】
より具体的には、ホワイトボードビューを修正することには、各イメージのホワイトボードでない領域をトリミングすることが関与する。次に、各イメージの中でホワイトボードの4つの隅が指定される。各イメージに関して、バイキュービック(bi−cubic)補間を使用してバイリニアワープ(bi−linear warp)を行って、それぞれのキャプチャされたイメージの中でトリミングされ、修正されたホワイトボードイメージを獲得する。
【0017】
ホワイトボード背景色を抽出するために2つの方法を使用することができる。第1の方法は、最も明るい輝度および最も小さい変動を有するホワイトボードセルを判定することに関する。最も明るい輝度および最も小さい変動を有する色をホワイトボード背景色として指定する。このようにして、ホワイトボード背景色が決定されると、ホワイトボードの色におけるどんなホール(holes)も見出され、各ホールの周囲のホワイトボードセルを探索することによって埋められる。次に、各ホールの色は、ホールでない最も近接したセルの色に設定される。
【0018】
ホワイトボード背景色を抽出するための第2の方法は、ホワイトボードイメージ輝度のヒストグラムを作成して、ピークのホワイトボード輝度を判定することに関する。ピークの輝度に対応する色が、初期のホワイトボードの色として指定される。次に、あらゆるホワイトボードの色の外れ値(誤ったデータ)が、最小2乗平均法を使用して判定される。この外れ値(outliers)は、ホールとしてマークが付けられ、前述したホワイトボードの色を決定する第1の方法と同じやり方で埋められる。各ホールを埋めた後、ホワイトボードのカラーイメージをフィルタリングすることができる。
【0019】
入力シーケンスの中の各イメージをセルに分割するプロセスにより、解析処理速度が向上する。通常、各イメージは、セルサイズが、ボード上の単一の文字とほぼ同じサイズになるようにセルに分割される。これは、縦1.5インチ(3.8センチメートル)、横1.5インチ(3.8センチメートル)、または通常の会議サイズのホワイトボードの場合、縦25画素、横25画素に等しい。ただし、別法では、すべての解析を画素ごとに行うことができる。
【0020】
入力イメージのシーケンスが修正され、ホワイトボードの色が決定された後、セルイメージがクラスタ化される。時間を経て同一であると見なされるセルイメージが、グループに一緒にクラスタ化される。正規化された相互相関法およびマハラノビス(Mahalanobis)距離試験を使用して、2つのセルが同一であるかどうかを判定する。
【0021】
セル分類プロセスにより、セルイメージが、ホワイトボードセルであるか、ストロークであるか、または前景オブジェクトであるかが判定される。セルイメージは、レッド、グリーン、ブルー(RGB)の値がほぼ同一である場合、ホワイトボードセルとして指定される。あるいは、セルイメージは、そのセルが大体において白またはグレーであり、1つまたは2つの原色が混じっている場合、ストロークセルとして指定される。そうでない場合、セルイメージは、前景セルとして指定される。セル分類プロセスにより、現行のセルイメージの色分布、および対応するホワイトボードセルの色分布が判定される。次に、セルは、現行のセルイメージおよび対応するホワイトボードセルの色分布が同一であるか、同一ではないが、強い類似性を有しているか、または全く異なっているかに基づいて分類される。
【0022】
前述した分類手続きは、単一のセル内の色情報を使用するだけである。セルグループ間の空間的関係および時間的関係を利用することによってより正確な結果を得ることができる。空間的にフィルタをかける際、すべてのホワイトボードイメージに対して2つの動作を行うことができる。第1に、孤立した前景セルを識別し、ストロークとして分類しなおす。第2に、いくつかの前景セルに直結しているストロークセルを前景セルとして分類しなおす。時間的にフィルタをかけることに関して、基本的な知見は、ストロークが消去された後、まったく同一の位置に同じストロークを書き込むのは、実質的に不可能であるということである。言い換えれば、任意の所与のセルに関して、2つの異なるフレームのセルイメージが、同一のストロークを有する場合、その2つのフレームの間のすべてのセルイメージは、そのセルを遮る前景オブジェクトが存在しない限り、同一のストロークを有するはずである。時間的にフィルタをかけるステップで、このセルは、前景オブジェクトがこのセルを遮った前後にカメラに晒されている限り、ストロークとして分類される。
【0023】
次に、キーフレームを抽出することができる。この目的で、イメージのシーケンスの中の各イメージまたは各フレームに関して、分類結果が使用され、ストロークセルが計数される。ストロークカウントのピーク(peak)とくぼみ(valley)が判定される。ストロークカウントのそれぞれ隣接するピークとくぼみの間の差が、規定されたしきい値を超えた場合、くぼみとくぼみの間のデータが、区分(chapter)(各区分は、異なるトピックを意味する)として指定され、また各区分の中のピークが、その区分を代表するキーフレームとして指定される。
【0024】
次に、キーフレームイメージが再構成される。これには、分類されたセルイメージ、およびセルイメージに分割されたキーフレームを入力することが関与する。キーフレームのセルイメージが、ホワイトボードイメージまたはストロークイメージとして分類される場合、キーフレームのイメージは、それぞれ、ホワイトボードイメージまたはストロークイメージとしてレンダリングされる。あるいは、キーフレームの前景セルイメージが、ストロークの範囲内にある場合、そのセルイメージは、シーケンスの中の隣接するイメージからのストロークのセルイメージとともにレンダリングされる。キーフレームのセルイメージは、ホワイトボードイメージ、ストロークイメージ、またはストロークの範囲内の前景セルとして分類されない場合、ホワイトボードイメージとしてレンダリングされる。
【0025】
次に、カラーバランス処理を使用して、平均のホワイトボードの色を使用してセル内の各画素の色を調整する(scale)ことによって背景を一様に白くし、ペンストロークの色の彩度を高めることによってキーフレームのイメージ品質を向上させる。また、イメージノイズも低減される。
【0026】
アナリシスサーバが、イメージシーケンスを処理し、インデックスおよびキーフレームイメージを生成した後、処理済みの記録のユニフォームリソースロケータ(Uniform Resource Locator)(URL)(Webサイトまたはその他のインターネットサービスの「アドレス」またはロケーション)を伴う電子メールを登録されたセッション参加者に送信する。ユーザは、そのURLをクリックして、ブラウズソフトウェアを立ち上げることができる。ブラウザにより、ユーザは、キーフレームイメージを閲覧し、特定のトピックに関連する音声に迅速にアクセスすることが可能になる。
【0027】
ブラウズソフトウェアのユーザインターフェース(UI)は、様々な構成要素を有する。ブラウザUIの主要な要素には、キーフレームサムネールが表示されるキーフレームペイン(pane)、並びにカメラからの生のイメージと現行のキーフレームイメージの合成を示すブラウザのメイン表示ペインが含まれる。
【0028】
また、キーフレームペインには、ユーザが、メイン表示ペイン内に表示されたイメージを調整して生の入力イメージからキーフレームイメージにすることを可能にする背景透明スライダ(transparency slider)も組み込まれている。会議再生タイムラインにおいて既に書き込まれているストロークである現行のペンストロークが、将来のストロークよりも濃く、より明確にレンダリングされる。参加者が将来に書き込むことになるペンストロークは、ゴースト(ghost)のようなスタイルで示される。この映像化の技法は、次のプロセスを使用して実現される。現行のホワイトボードの内容が、現行の区分のキーフレームイメージ、およびタイムスタンプ情報を使用してレンダリングされる。次に、将来のストロークが、ガウスフィルタを使用してグレースケールに変換され、ぼかされてレンダリングされる。次に、以上の2つのイメージが合わせられ、もたらされたイメージが、入力シーケンスからの修正されたイメージにアルファブレンド(alpha−blend)される。ユーザは、レンダリングされたキーフレームホワイトボードイメージだけを示す0から、元のイメージそのものを示す1まで、GUIスライダを使用してアルファ値を制御することができる。
【0029】
VCR−標準タイムラインコントロールが、メイン表示ペインの下でブラウザUIの左下隅に提供される。VCR−標準タイムラインコントロールにより、ユーザは、通常のビデオカセットレコーダ(VCR)上に見られるコントロールと同じように、イメージ/音声シーケンスをゆっくりと、または迅速に戻すこと、または先に進めること、または停止させることが可能になる。タイムラインバーが、音声/イメージシーケンスの長さをバーとしてグラフィックスで表示し、会議再生の開始時刻、終了時刻、および現在時刻の数値を提供する。このバーの上のポインタを選択し、タイムラインバーに沿って前後にドラッグして、イメージ/音声シーケンスを直線的に先に進めること、および戻すことができる。
【0030】
記録された音声に対する2つのレベルの非線形アクセスが、ビジュアル式インデックス付け(visual indexing)のコンテキストで提供される。第1のレベルの非線形アクセスは、キーフレームサムネールの使用を介する。ユーザは、キーフレームサムネールをクリックして、対応するキーフレームに関する音声の開始ポイント(例えば、区分の先頭)にジャンプすることができる。各キーフレームには、その特定のキーフレームに関連する時間範囲を判定する際にユーザを助ける時間範囲が関連付けられている。記録された音声に対する第2のレベルの非線形アクセスは、各キーフレーム内のペンストロークの使用を介する。カーソルが、メインウインドウの中でペンストロークセル(現在のストロークセルまたは将来のストロークセル)の上を行き来(hover)しているとき、そのカーソルが、そのセルが選択可能(例えば、マウスで「クリック可能」)であることを示す「手」の記号に変化する。マウス、またはその他の入力デバイスでセルをダブルクリックすることにより、アプリケーションが、音声再生モードにされる。再生は、クリックされたストロークセルが書き込まれたセッションの時点から開始する。ユーザは、それでも、他のストロークセルをクリックしてセッションの他の部分にジャンプすることができる。VCR−標準タイムラインコントロール1514と併せて、以上の2つのレベルのビジュアル式インデックス付けにより、ユーザは、非常に効率的な仕方で会議をブラウズすることが可能になる。
【0031】
前述したとおり、キーフレームイメージのサムネールは、キーフレームペインの中にリストされる。サムネールの1つを選択することにより、対応するキーフレームイメージが、左側でメインウインドウにもたらされ、アプリケーションが、イメージビューイングモードにされ、このモードで、ユーザが、ズーム制御ボタンを使用してズームインおよびズームアウトを行うこと、イメージの中のテキストおよび図を読むこと、またはイメージの一部分を他のドキュメントにカットアンドペーストすることができる。さらに、キーフレーム全体を他のドキュメントにカットアンドペーストすること、またはメモとして印刷することができる。
【0032】
本ホワイトボードキャプチャシステムでは、会議参加者が、会議記録の始めにキャプチャソフトウェアに登録するように求められる。すべての記録されたセッションが、Webサーバ上に常駐する。誰も登録しなかった場合、会議は、公衆アクセス可能なWebページに掲示される。少なくとも1名の参加者が登録した場合、会議の記録および解析の後、アクセストークンが生成される。トークンは、固有の会議識別子を含む長いランダムに生成されたストリングである。そのトークンを含むURLが、登録された参加者に電子メールで送信される。受け手は、そのURLに行ってWebブラウズソフトウェアを立ち上げて会議を綿密に見る(review)。受け手は、その会議に出席しなかった人々にそのURLを転送することもできる。
【0033】
前述した基本的なホワイトボードキャプチャシステムを多くの他の技術およびデバイスと組み合わせて代替の実施形態を提供することも可能である。1つのそのような実施形態では、キーフレームに対して従来の光学式文字認識(Optical Character Recognition)(OCR)が行われて、ドキュメントまたはプレゼンテーションビューグラフ(viewgraph)を作成するのに簡単に使用される編集可能なテキストが提供される。
【0034】
別の実施形態では、従来の音声認識ソフトウェアを使用してキャプチャされたデータの音声部分がテキストに変換される。これにより、会議の議事録およびその他のドキュメントを容易に作成することが可能になる。また、会議情報を聴覚障害者に提供する比較的安価な手立ても提供される。
【0035】
また、本ホワイトボードキャプチャシステムは、例えば、三脚の上に装着されたマイクロホンおよびカメラを備えたノートコンピュータを使用してポータブルにすることも可能である。この構成は、ホワイトボードに対するカメラの位置を決める追加の初期較正だけを必要とする。この較正は、イメージの中のパネルの4つの隅を手作業で決めることによって手作業で、またはエッジ検出などの方法を使用することによって自動的に行うことが可能である。
【0036】
また、ホワイトボードの内容を推測するのにペン追跡を使用するホワイトボードキャプチャシステムとともに本ホワイトボードキャプチャシステムの解析ソフトウェアを使用して、キーフレームを決定することも可能である。そのようなシステムとともに本ホワイトボードキャプチャシステムの解析ソフトウェアを使用することにより、解析プロセスが単純化される。ホワイトボード背景色の決定、またはホワイトボード領域修正の必要性はなく、空間的にフィルタをかけること、および時間的にフィルタをかけることも必要なく、またセルイメージがストロークまたはホワイトボードであるため、ホワイトボードセルの分類がより簡単である。というのは、ホワイトボード上に書き込まれたテキストを妨げる前景イメージが存在しないからである。
【0037】
さらに、より高いフレームレートを実現するため、スチールカメラの代わりに、HDTVカメラなどの高解像度のビデオカメラを使用することができる。
【0038】
さらに別の実施形態では、本ホワイトボードキャプチャシステムは、ジェスチャ認識を組み込んでジェスチャコマンドを使用する。例えば、ホワイトボード上のどこかにコマンドボックスが書き込まれていることが可能である。ユーザが動いたとき、またはボックスを指し示したとき、システムは、ジェスチャ認識を使用してそのジェスチャが行われた特定の時刻におけるイメージにタイムスタンプを付ける。
【0039】
本ホワイトボードキャプチャシステムにより、会議参加者は、日常的なノートをとる作業を免れ、会議中に意見を出すこと、および意見を吸収することに集中できるようになる。ホワイトボードの内容を要約するキーフレームイメージ、および音声に対する構造化されたビジュアル式インデックス付けを提供することにより、システムは、参加者が、後の時点で会議を綿密に見ることを助ける。さらに、会議に出席しなかった人々が、しばしば、瞬時に会議の要点を理解することができる。
【0040】
本発明の具体的な特徴、態様、および利点は、以下の説明、頭記の特許請求の範囲、および添付の図面に関連してよりよく理解される。
【0041】
【発明の実施の形態】
本発明の好ましい実施形態の以下の説明では、説明の一部を成す添付の図面を参照する。図面では、例として、本発明を実施することができる特定の実施形態を示している。本発明の範囲を逸脱することなく、他の実施形態を利用することができ、また構造上の変更を加えることができることを理解されたい。
【0042】
1.0 例示的な動作環境
図1は、本発明を実施することができる適切なコンピューティングシステム環境100の例を示している。コンピューティングシステム環境100は、適切なコンピューティング環境の一例に過ぎず、本発明の使用または機能の範囲に対する何らかの限定を示唆するものではない。また、コンピューティング環境100は、例示的な動作環境100に示した構成要素のいずれか1つ、またはいずれかの組合せに関連する依存性または要件を有するものと解釈してはならない。
【0043】
本発明は、多数の他の汎用または特殊目的のコンピューティングシステム環境またはコンピューティングシステム構成で機能する。本発明で使用するのに適していることが可能な周知のコンピューティングシステム、コンピューティング環境、および/またはコンピューティング構成の例には、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドデバイスまたはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラマブル家庭用電化製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、前述したシステムまたはデバイスの任意のものを含む分散コンピューティング環境等が含まれるが、以上には限定されない。
【0044】
本発明は、コンピュータによって実行される、プログラムモジュールなどのコンピュータ実行可能命令の一般的なコンテキストで説明することができる。一般に、プログラムモジュールには、特定のタスクを行う、または特定の抽象データタイプを実装するルーチン、プログラム、オブジェクト、構成要素、データ構造等が含まれる。また、本発明は、通信網を介してリンクされた遠隔の処理デバイスによってタスクが行われる分散コンピューティング環境において実施することもできる。分散コンピューティング環境では、プログラムモジュールは、メモリ記憶デバイスを含むローカルのコンピュータ記憶媒体と遠隔のコンピュータ記憶媒体の両方の中に配置されることが可能である。
【0045】
図1を参照すると、本発明を実施するための例示的なシステムが、コンピュータ110の形態で汎用コンピューティングデバイスを含んでいる。コンピュータ110の構成要素には、処理ユニット120、システムメモリ130、並びにシステムメモリから処理ユニット120までを含む様々なシステム構成要素を結合するシステムバス121が含まれることが可能であるが、以上には限定されない。システムバス121は、様々なバスアーキテクチャの任意のものを使用するメモリバスまたはメモリコントローラ、周辺バス、およびローカルバスを含むいくつかのタイプのバス構造の任意のものであることが可能である。例として、限定としてではなく、そのようなアーキテクチャには、インダストリスタンダードアーキテクチャ(Industry Standard Architecture)(ISA)バス、マイクロチャネルアーキテクチャ(Micro Channel Architecture)(MCA)バス、エンハンストISA(Enhanced ISA)(EISA)バス、ビデオエレクトロニクススタンダーズアソシエーション(Video Electronics Standards Association)(VESA)ローカルバス、およびメザニン(Mezzanine)バスとしても知られるペリフェラルコンポーネントインターコネクト(Peripheral Component Interconnect)(PCI)バスが含まれることが可能である。
【0046】
コンピュータ110は、通常、様々なコンピュータ可読媒体を含む。コンピュータ可読媒体は、コンピュータ110によってアクセス可能な任意の利用可能な媒体であることが可能であり、揮発性の媒体と不揮発性の媒体、取外し可能な媒体と取外し不可能な媒体がともに含まれる。例として、限定としてではなく、コンピュータ可読媒体は、コンピュータ記憶媒体および通信媒体を含むことが可能である。コンピュータ記憶媒体には、コンピュータ可読命令、データ構造、プログラムモジュール、またはその他のデータなどの情報を記憶するための任意の方法または任意の技術で実装される揮発性の媒体および不揮発性の媒体、取外し可能な媒体および取外し不可能な媒体がともに含まれる。コンピュータ記憶媒体には、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD−ROM、デジタルバーサタイルディスク(DVD)または他の光ディスクストーレッジ、磁気カセット、磁気テープ、磁気ディスクストーレッジまたは他の磁気記憶デバイス、あるいは所望の情報を記憶するのに使用することができ、コンピュータ110がアクセスすることができる任意の他の媒体が含まれるが、以上には限定されない。通信媒体は、通常、搬送波などの変調されたデータ信号、または他のトランスポート機構でコンピュータ可読命令、データ構造、プログラムモジュール、またはその他のデータを実体化し、あらゆる情報配信媒体が含まれる。「変調されたデータ信号」という用語は、信号に情報を符号化するような仕方で特徴の1つまたは複数が設定または変更されている信号を意味する。例として、限定としてではなく、通信媒体には、有線ネットワークまたは直接配線接続などの有線媒体、並びに音響媒体、RF媒体、赤外線媒体、およびその他の無線媒体などの無線媒体が含まれる。また、前述したもののいずれかの組合せも、コンピュータ可読媒体の範囲に含まれるべきものである。
【0047】
システムメモリ130は、読取り専用メモリ(ROM)131およびランダムアクセスメモリ(RAM)132などの揮発性メモリおよび/または不揮発性メモリの形態でコンピュータ記憶媒体を含む。始動中など、コンピュータ110内部の要素間で情報を転送するのを助ける基本ルーチンを含む基本入力/出力システム133(BIOS)が、通常、ROM131の中に記憶されている。RAM132は、通常、処理ユニット120によって即時にアクセス可能であり、かつ/または現在、処理されているデータおよび/またはプログラムモジュールを含む。例として、限定としてではなく、図1は、オペレーティングシステム134、アプリケーションプログラム135、その他のプログラムモジュール136、およびプログラムデータ137を示している。
【0048】
また、コンピュータ110は、他の取外し可能な/取外し不可能な、揮発性/不揮発性のコンピュータ記憶媒体を含むことも可能である。単に例として、図1は、取外し不可能な不揮発性の磁気媒体に対して読取りおよび書込みを行うハードディスクドライブ141、取外し可能な不揮発性の磁気ディスク152に対して読取りおよび書込みを行う磁気ディスクドライブ151、およびCD−ROMまたは他の光媒体などの取外し可能な不揮発性の光ディスク156に対して読取りおよび書込みを行う光ディスクドライブ155を示している。例示的な動作環境において使用することができる他の取外し可能な/取外し不可能な揮発性/不揮発性のコンピュータ記憶媒体には、磁気テープカセット、フラッシュメモリカード、デジタルバーサタイルディスク、デジタルビデオテープ、ソリッドステートRAM、ソリッドステートROM等が含まれるが、以上には限定されない。ハードディスクドライブ141は、通常、インターフェース140のような取外し不可能なメモリインターフェースを介してシステムバス121に接続され、また磁気ディスクドライブ151および光ディスクドライブ155は、通常、インターフェース150のような取外し可能なメモリインターフェースでシステムバス121に接続される。
【0049】
前述し、図1に示すドライバおよび関連するコンピュータ記憶媒体により、コンピュータ可読命令、データ構造、プログラムモジュール、およびその他のデータのストーレッジがコンピュータ110に提供される。図1では、例えば、ハードディスクドライブ141が、オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146、およびプログラムデータ147を記憶しているものとして示されている。以上の構成要素は、オペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136、およびプログラムデータ137と同じであることも、異なることも可能であることに留意されたい。オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146、およびプログラムデータ147に、ここでは、少なくともそれらが異なるコピーであることを示すために異なる符号を付けている。ユーザは、キーボード162、および一般にマウス、トラックボール、またはタッチパッドと呼ばれるポインティングデバイス161などの入力デバイスを介してコンピュータ110にコマンドおよび情報を入力することができる。他の入力デバイス(図示せず)には、マイクロホン、ジョイスティック、ゲームパッド、サテライトディッシュ、スキャナ等が含まれる可能性がある。以上の入力デバイスおよび他の入力デバイスは、しばしば、システムバス121に結合されたユーザ入力インターフェース160を介して処理ユニット120に接続されるが、パラレルポート、ゲームポート、またはユニバーサルシリアルバス(Universal Serial Bus)(USB)などの他のインターフェースおよびバス構造で接続してもよい。また、モニタ191または他のタイプの表示デバイスも、ビデオインターフェース190などのインターフェースを介してシステムバス121に接続される。モニタに加えて、コンピュータは、出力周辺インターフェース195を介して接続することができるスピーカ197やプリンタ196などの他の周辺出力デバイスも含むことが可能である。本発明に特に重要なこととして、一続きのイメージ164をキャプチャすることができるカメラ163(デジタル/電子式のスチールカメラまたはビデオカメラ、またはフィルム/写真スキャナ)も、パーソナルコンピュータ110に対する入力デバイスとして含まれることが可能である。さらに、1つのカメラだけを描いているが、複数のカメラが、パーソナルコンピュータ110に対する入力デバイスとして含まれることも可能である。1つまたは複数のカメラからのイメージ164が、適切なカメラインターフェース165を介してコンピュータ110に入力される。このインターフェース165は、システムバス121に接続され、これにより、イメージをRAM132、またはコンピュータ110に関連する他のデータ記憶デバイスの1つにルーチングして、その中に記憶することができるようになる。ただし、イメージデータは、カメラ163の使用を必要とすることなしに、前述したコンピュータ可読媒体の任意のものからもコンピュータ110に入力することができることに留意されたい。
【0050】
コンピュータ110は、リモートコンピュータ180のような1つまたは複数のリモートコンピュータに対する論理接続を使用するネットワーク化された環境で動作することも可能である。リモートコンピュータ180は、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピアデバイス、または他の一般的なネットワークノードであることが可能であり、通常、コンピュータ110に関連して前述した要素の多く、またはすべてを含むが、メモリ記憶デバイス181だけを図1に示している。図1に描いた論理接続は、ローカルエリアネットワーク(LAN)171およびワイドエリアネットワーク(WAN)173を含むが、他のネットワークを含むことも可能である。そのようなネットワーキング環境は、オフィス、企業全体のコンピュータネットワーク、イントラネット、およびインターネットで一般的である。
【0051】
LANネットワーキング環境で使用されるとき、コンピュータ110は、ネットワークインターフェースまたはネットワークアダプタ170を介してLAN171に接続される。WANネットワーキング環境で使用されるとき、コンピュータ110は、通常、インターネットなどのWAN173を介して通信を確立するためのモデム172、または他の手段を含む。内部にあることも、外部にあることも可能なモデム172は、ユーザ入力インターフェース160または他の適切な機構を介してシステムバス121に接続することが可能である。ネットワーク化された環境では、コンピュータ110に関連して描いたプログラムモジュール、またはプログラムモジュールの部分を遠隔のメモリ記憶デバイスの中に記憶することができる。例として、限定としてではなく、図1は、リモートアプリケーションプログラム185をメモリデバイス181上に常駐するものとして示している。図示したネットワーク接続は、例示的なものであり、コンピュータ間で通信リンクを確立する他の手段を使用してもよいことが認められよう。
【0052】
以上、例示的な動作環境について述べたので、この説明のセクションの以下の部分は、本発明を実現するプログラムモジュールの説明に向けられる。
【0053】
2.0 ホワイトボードキャプチャのシステムおよび方法
2.1 システムアーキテクチャ
概念上、本ホワイトボードキャプチャシステムは、図2に示すとおり、3つの主要な構成要素、すなわち、キャプチャユニット202、解析/処理サーバ204、およびブラウズソフトウェア206から成る。
【0054】
1.キャプチャユニット:キャプチャユニットは、ホワイトボードの内容のイメージをキャプチャし、ホワイトボードの内容の生成に関連する音声を記録するのに使用される。キャプチャユニットは、会議が行われる部屋の中に設置される。図3に示すとおり、キャプチャユニットは、デジタルカメラ302、マイクロホン304、およびパーソナルコンピュータ(PC)306を含む。キャプチャユニットは、ホワイトボード308のイメージを取り込み、PC306に記憶される音声をマイクロホン304を介して記録する。取り込まれたイメージと音声の両方にタイムスタンプが付けられる。イメージおよび音声サンプルは、通常、システムクロックである共通クロックで獲得される。その共通クロックのタイミングが、イメージおよび音声サンプルに関連付けられ、イメージおよび音声サンプルのタイムスタンプとして記憶される。
【0055】
2.アナリシスサーバ:アナリシスサーバ204は、中心的な場所に配置され、記録されたイメージデータを解析して記憶する。一実施形態では、ユーザが、キャプチャユニットにおける記録を停止した後、解析プログラムが自動的に立ち上げられる。記録されたデータを処理した後、会議記録が用意されているURLを含む電子メールが、登録済みの参加者に送信される。登録済みのユーザが存在しない場合、会議記録は、公衆アクセス可能なWebサイトに掲示されることが可能である。
【0056】
3.ブラウズソフトウェア:ブラウズソフトウェア206により、ユーザは、記録され、解析された会議データを閲覧すること、および再生することができるようになる。ブラウズソフトウェア206は、好ましくは、会議記録を閲覧することを望むユーザによってインストールされるWebプラグインとして提供される。インストールされると、ユーザは、前述したURLをクリックしてそのソフトウェアを立ち上げてアナリシスサーバ上のデータにアクセスすることができる。
【0057】
2.2 イメージ獲得
本ホワイトボードキャプチャシステムへの入力は、1組の静止デジタルイメージである。図4は、例示的な1組のそのようなイメージを示している。このイメージシーケンスを解析して、ユーザがボード上でいつどこに書込みを行ったかを判別し、セッション全体のホワイトボードの内容を要約する1組のキーフレームイメージを取り出す。
【0058】
コンピュータによるカメラ制御を可能にする任意の比較的高解像度のカメラをイメージ獲得のために使用することができる。カメラは、好ましくは、会議室の側方または後方に設置される。カメラは、可能な限りホワイトボードに近接してズームインして有効解像度を最大化する。カメラは、設置後、固定であり、ホワイトボードは動かないことが想定され、したがって、ホワイトボードイメージは、キャプチャされたシーケンス全体で静止したものである。
【0059】
使用されるカメラが自動焦点モードだけしか有さない場合、ホワイトボードの手前の被写体が、カメラの自動焦点機構の注意を引き起こしたとき、ホワイトボードに焦点が合わなくなる可能性がある。この問題は、カメラのイメージ平面を可能な限りホワイトボードに平行に揃えてシーン深度(scene depth)を最小化し、かつ/または絞りを最小化して被写界深度を大きくすることによって緩和することができる。実際には、本ホワイトボードキャプチャシステムの実用の実施形態では、1〜2%のフレームだけで、焦点が合っていないことが見られた。
【0060】
カメラは、できる限り迅速に写真を撮影し、そのイメージを、好ましくはUSB接続を介して、PCに転送する。本ホワイトボードキャプチャシステムの実用の実施形態では、およそ5秒毎に1つのJPEGイメージが獲得された。露出およびホワイトバランス(white−balance)パラメータは、通常、一定に保たれる。照明セッティングが1つのセッション中に変化しないと想定すると、ホワイトボード背景色は、シーケンスの中で一定に留まるはずである。
【0061】
わずかに露出不足のイメージの方が、より良好な色の彩度をもたらし、これにより、以下に述べるストローク抽出プロセスがより正確になる。カラーバランス処理のステップを記録の後に行って、グレーがかったホワイトボードイメージをより見栄えのよいものにすることができる。
【0062】
2.3 イメージシーケンス解析
ボードに書込みをしている人物は、デジタルカメラとホワイトボードの間の照準線上にいるので、しばしば、ホワイトボードのある部分を覆い隠し、別の部分に影を落とす。ストロークから、前景オブジェクト(例えば、ボード上に書込みをしている人物)およびホワイトボードを区別することが必要である。分類結果が分かると、キーフレームイメージおよびインデックスをブラウズソフトウェアが使用することができる。
【0063】
画素ごとのレベルでイメージを解析するのではなく(それを行うことは可能であるが)、ホワイトボード領域を長方形のセルに分割して計算コストを下げる。セルサイズは、ボード上の単一の文字の予期されるサイズ(実用の実施形態では、縦1.5インチ(3.8センチメートル)、横1.5インチ(3.8センチメートル)、または縦25画素、横25画素)とほぼ同じになるように選択する。セル格子により、入力シーケンスの中の各フレームがセルイメージに分割されるので、入力は、セルイメージの3次元マトリックス(例えば、x、y、時間)として考えることができる。各イメージをセルに分割することは、通常、入力イメージが修正された後に行われる。
【0064】
図5および以下に示すとおり、入力イメージシーケンスを解析する手続きの一般的なプロセスステップは、以下のとおりである。
1.シーケンスの中のすべてのイメージのホワイトボード領域を修正する(プロセスステップ502)
2.ホワイトボード背景色を抽出する(プロセスステップ504)
3.シーケンスの中のすべてのイメージを対応するセルイメージ(プロセスステップ506)に分割した後、同じセルに関してシーケンス全体のセルイメージをクラスタ化する。2つのセルイメージが時間を経て同じであると考えられる場合は、2つのセルイメージは同じグループにクラスタ化される
4.各セルイメージをストローク、前景オブジェクト、またはホワイトボードとして分類する(プロセスステップ508)
5.セルイメージを空間的にも、時間的にもフィルタにかけて分類結果を精密にする(プロセスステップ510)
6.分類結果を使用してキーフレームイメージを抽出する(プロセスステップ512)
7.キーフレームイメージのカラーバランス処理を行う(プロセスステップ514)
【0065】
以下の段落では、図4に示した実用例を使用して入力イメージシーケンス解析手続きを例示する。
【0066】
2.3.1 ホワイトボードイメージを修正すること
イメージシーケンスをストローク抽出プロセスに送り込む前に、ホワイトボードでない領域をトリミングして、イメージを修正する。実用の実施形態で使用されるカメラのレンズの径方向の歪みは相当に小さいので、ホワイトボードの4つの隅を特定するだけでよい(歪みが小さくない場合、イメージを修正することに先立って、従来の方法で径方向の歪みを補正する必要がある可能性がある)。これは、1回限りの較正ステップ中にキャプチャされたイメージの中でホワイトボードの4つの隅の位置をクリックすることにより、手作業で行われるが、自動的に(例えば、エッジ検出を使用することにより)行うことも可能である。その4つの隅で、バイキュービック補間を使用して各イメージに関して簡単な従来のバイリニアワープを行い、それぞれのキャプチャされたイメージの中でトリミングされ、修正されたビューを獲得する。
【0067】
2.3.2 ホワイトボードの色を計算すること
セルの分類のため、各セルに関してホワイトボードの色がどのようなものであるか(つまり、何も書き込まれていないホワイトボード自体の色)を知ることが必要である。また、ホワイトボードの色は、キーフレームを生成する際のホワイトバランス処理のためにも使用され、したがって、正確に推定してキーフレームイメージの高い品質を確実にしなければならない。
【0068】
ホワイトボードの色を計算するために2つの戦略が使用されてきた。図6Aに概略を述べた第1の戦略は、ホワイトボードセルが、時間の経過で見ると最も明るい輝度を有し、小さい変動(すなわち、各セル内でほとんど一様である)という前提に基づいている。この前提は、ストロークの色(レッド、グリーン、ブルー、または黒)が輝度を低下させるので、妥当である。プロセスステップ602に示したとおり、最も明るい輝度および最も小さい変動(variance)を有するホワイトボードセルが計算される。ただし、これにより、最終のホワイトボードのカラーイメージにホールを生じさせる可能性がある。例えば、セルが、ストロークを含むか、またはシーケンス全体で前景オブジェクトによって遮られている場合、このセルに関して計算されたホワイトボードの色は正しくなくなる(このセルが、ホワイトボードの残りの部分とは異なって見え、したがって、ホールのように見える)。このため、プロセスステップ604に示すとおり、ホワイトボードのカラーイメージにおけるホールが存在すれば、最小2乗平均法と呼ばれる技法(次の段落で説明する外れ値検出方法と同様の)を使用してそのホールが検出される。次に、そのホールが埋められる(プロセスステップ606)。ホールを埋めるため、ホールの近辺が探索され、ホワイトボードの色は、ホールでない最も近接したセルの色に設定される。この戦略は、通常、極めてうまく行くが、人物が白いTシャツを着ており、かつ/または白い紙を手に持っている場合、失敗する。図7の左側のイメージは、フレームのいくつかの中で人物が白い紙を手に持っている場合の、図4の入力シーケンスから計算されたホワイトボードのカラーイメージの結果を示している。計算されたホワイトボードの色が、白い紙によって損なわれているのを見て取ることができる。
【0069】
ホワイトボードの色を判定する第2の戦略を図6Bに示しており、この戦略は、より高度である。前提は、時間の経過で見ると各セル内の画素の相当な部分が、ホワイトボードに属するということである。各セルに関する輝度のヒストグラムを作成することにより、高い輝度値を有するピークに対応する色が、そのセルに関するホワイトボードの色である可能性が非常に高い。したがって、第1のステップは、各セルに関してヒストグラムを作成し、ピークの輝度を計算して(プロセスステップ610ないし614)、このやり方で初期のホワイトボードの色を計算することである。この技法は、セルが、シーケンス全体でストロークを含む場合でもうまく行くが、人物が、白いTシャツを着ており、かつ/または白い紙を手に持っている場合、またはセルが、人々またはその他の物体で常に隠れている場合、失敗する。そのような場合、計算されたホワイトボードのカラーイメージは、外れ値を含む。次の動作は、外れ値があれば、それを検出することである(プロセスステップ616)。外れ値検出は、最小2乗平均法と呼ばれる堅牢な技法に基づく。色が、ホワイトボード全体で平滑に変化するものと想定すると、2乗誤差の平均を最小化することによって輝度YまたはRGBの空間に平面が合わせられる。色がこのモデルに従わないセルは、外れ値と見なされ、したがって、拒否される。すなわち、ホールとしてマークが付けられる(プロセスステップ618)。関心のある読者は、この技法の詳細については、付録を参照されたい。次に、プロセスステップ620に示すとおり、第1のホワイトボードの色を計算する戦略と同じ手続きを使用することによってホールが埋められる(プロセスステップ620)。最後に、結果をさらに向上させるため、平面をRGB空間に局所的に合わせることによってホワイトボードのカラーイメージをフィルタリングすることができる(プロセスステップ622)。関心のある読者は、やはり詳細については、付録を参照されたい。同一の例に対するこの新しい技法を使用して得られた結果を図7の中央のイメージに示している。左側に示した第1の戦略を使用して得られた結果に優る明らかな向上が見られる。実際の空白のホワイトボードも、比較のために右側のイメージで示している。
【0070】
2.3.3 時間にわたってセルイメージをクラスタ化すること
会議中、各セルの内容は、通常、時間とともに変化する。各セルに関して、時間シーケンスの中のすべてのセルイメージを、時間を経て同じであると見なされるセルイメージをそれぞれが含むグループにクラスタ化することが望まれる。変更された正規化された相互相関アルゴリズムを使用して、2つのセルイメージが同じであるか否かを判定する。以下に、正規化された相互相関法をイメージの1つの色成分を使用して説明するが、この技法は、RGB成分のすべてに適用される。
【0071】
2つのセルイメージIおよびI’を考慮されたい。
【0072】
【数11】
Figure 2004080750
【0073】
および
【0074】
【数12】
Figure 2004080750
【0075】
を平均の色とし、σおよびσ’を標準偏差とする。正規化された相互相関スコアは、
【0076】
【数13】
Figure 2004080750
【0077】
によって与えられ、ただし、総和は、すべての画素iを対象とし、Nは、画素の総数である。スコアは、2つのイメージが全く類似していない場合の−1から、2つのイメージがまったく同一である場合の1までの範囲にある。このスコアは、平均の色を引いた後に計算されるので、2のイメージが非常に異なる平均の色を有している場合でも、高い値を与える可能性がある。したがって、マハラノビス距離に基づいて平均の色の差に対してさらなる試験を使用し、この試験は、
【0078】
【数14】
Figure 2004080750
【0079】
によって与えられる。要約すると、2つのセルイメージIおよびI’は、同一であると見なされ、したがって、d<Tかつc>Tである場合にだけ、同じグループに入れられるべきである。本ホワイトボードキャプチャシステムの実用の実施形態では、T=2およびT=0.707が成功裏に使用された。
【0080】
2.3.4 セルを分類すること
セルを分類するプロセスステップにより、セルイメージがホワイトボードであるか、ストロークであるか、または前景オブジェクトであるかが判定される。次のヒューリスティックが使用される。すなわち、1)ホワイトボードセルの色は、一様であり、グレーまたは白である(すなわち、RGB値は、ほぼ同じである)、2)ストロークセルは、大体において白またはグレーであり、1つまたは2つの主要な色が混じっている、3)前景オブジェクトは、以上の特性を有さない。したがって、分類により、現行のセルイメージの色分布とホワイトボードの色分布が同じであるか、または同じではないが、強い重なり合いを有しているか、または全く異なるかが判別される。この場合も、以下に説明するとおり、マハラノビス距離が使用される。
【0081】
ホワイトボードの色は、前述したとおり、既に計算済みであることに留意されたい。この場合も、RGBのどれかの色成分を例として使用する。
【0082】
【数15】
Figure 2004080750
【0083】
をホワイトボードの色とし、またσを標準偏差とする(これは、ホワイトボードセルがほぼ一様であるため、小さい値である)。
【0084】
【数16】
Figure 2004080750
【0085】
およびσを現行のセルイメージの平均および標準偏差とする。セルイメージは、
【0086】
【数17】
Figure 2004080750
【0087】
かつσ/σw<Tσである場合にだけ、ホワイトボードセルとして分類され、
【0088】
【数18】
Figure 2004080750
【0089】
かつ
【0090】
【数19】
Figure 2004080750
【0091】
である場合にだけ、ストロークセルとして分類され、それ以外の場合、前景オブジェクトセルとして分類される。本ホワイトボードキャプチャシステムの実用の実施形態では、T=2およびTσ=2が成功裏に使用された。
【0092】
2.3.5 セル分類をフィルタリングすること
前述した分類手続きは、単一のセル内の色情報を使用するだけである。セルグループ間の空間的関係および時間的関係を利用することによってより正確な結果を得ることができる。
【0093】
2.3.5.1 空間的にフィルタにかけること
空間的にフィルタにかけることに関して、基本的な知見は、人物が、通常、ホワイトボードの連続した領域を遮るので、前景セルは、空間的に孤立して現れないはずであるということである。空間的にフィルタにかける際、図8に示すとおり、すべてのホワイトボードイメージに対して2つの動作が行われる。第1に、孤立した前景セルが識別され、ストロークとして分類しなおされる(プロセスステップ802)。第2に、いくつかの前景セルに直結したストロークセルが、前景セルとして分類しなおされる(プロセスステップ804)。第2の動作の1つの主な目的は、前景オブジェクトの境界にあるセルに対処することである。そのようなセルがストロークを含む場合、第2の動作は、そのセルを前景オブジェクトとして誤って分類する。ただし、幸い、以下の時間的なフィルタリングにより、そのような誤りが生じた場合、それが訂正される。
【0094】
2.3.5.2 時間的にフィルタにかけること
時間的にフィルタにかけることに関して、基本的な知見は、ストロークを消去した後、同じストロークをまったく同じ位置に書き込むことが実質的に不可能であるということである。言い換えれば、任意の所与のセルに関して、2つの異なるフレームのセルイメージが同じストロークを含む場合、その2つのフレームの間のすべてのセルイメージは、そのセルを遮る前景オブジェクトが存在しない限り、同一のストロークを有するはずである。この知見は、前景オブジェクトを分けて除くのに非常に役立つ。前景オブジェクトの境界にあるストロークセルが、前景セルとして誤って分類される前のセクションの例を考慮されたい。時間的にフィルタにかけるステップで、そのセルは、前景オブジェクトがそのセルを遮った前後にカメラに晒されている限り、ストロークとして分類される。
【0095】
図9は、ストロークがグリーンであり、前景が黒であり、かつホワイトボードが白である場合の図4のサンプルイメージに関する分類結果を示している。
【0096】
2.3.6 キーフレームイメージ抽出
キーフレームイメージは、ホワイトボード上のすべての重要な内容を含み、記録の要約の役割をする。ユーザは、キーフレームイメージが、次のプロパティを有することを予期しているはずである。すなわち、2)キーフレームイメージは、ボード上のすべての重要な内容をキャプチャしていなければならない、2)キーフレームの数は、最小限に抑えられなければならない、3)キーフレームイメージは、ペンストロークおよびホワイトボードだけを含み、手前に人物を含んでいてはならない、4)キーフレームイメージは、容易なカットアンドペーストおよび印刷のため、一様の白い背景、および飽和度に達したペンの色を有していなければならない。
【0097】
キーフレーム抽出手続きは、前述したプロセスステップからのセルイメージ分類結果を使用する。この手続きは、まず、シーケンスの中のどのフレームがキーフレームとして選択されるべきかを決め、次に、キーフレームイメージを再構成する。これを以下により詳細に説明する。
【0098】
2.3.6.1 キーフレーム選択
キーフレームを選択する際、会議を要約するのに唯一のやり方が存在しないのと同様に、唯一の解決策は存在しない。最も一般的な意味で、図11を参照すると、ストローク、前景、またはホワイトボードとして分類されている入力イメージセルが使用されている(プロセスステップ1102)。会議は、まず、いくつかの区分(トピック)に分割される(プロセスステップ1104)。ボードの内容の大部分の消去により、普通、トピックの変化が示され、したがって、この消去が、区分の仕切りとして使用される。次に、ホワイトボードの内容を代表するキーフレームイメージが、その区分に関して生成される(プロセスステップ1106)。大部分の消去が始まる直前のフレームが、キーフレームとして選択され、これにより、そのフレーム内のコンテンツが保存されることが確実になる。図12に示した詳細な手続きは、以下のとおり行われる。
【0099】
1.シーケンスの中の各フレームに関するストロークセルの数が計数される(プロセスステップ1202)。1つのストロークセルイメージが、複数のフレームにまたがる、すなわち、そのフレームのそれぞれに関してカウントに含まれることが可能である。図10は、例のセッション(図4)におけるフレーム数に対してプロットされたストロークセルカウントを示している。プロットの上昇により、より多くのストロークがボード上に書き込まれたことが示され、プロットの下降(dip)により、いくつかのストロークが消去されたことが示される。このグラフには、極めてノイズが多い。次の2つの理由が存在する。すなわち、1)ユーザは、ボード上で常に小さい調整を行っている、2)分類結果は、小さい誤りを含む。
【0100】
2.様々なフレームに関するストロークカウントを使用して、ピークおよびくぼみが判別される(プロセスステップ1204)。各下降でキーフレームが生成された場合、数十のキーフレームがもたらされる。キーフレームの数を最小限に抑えるため、データをフィルタにかけて有意な消去イベントだけを留めておく。この手続きは、隣接するピークとくぼみの間の差が、あるしきい値を超えない限り、データの変動を無視する(プロセスステップ1206)。本システムの実用の実施形態では、最大ストロークカウントの20パーセントが成功裏に使用された。
【0101】
3.次に、データにおけるくぼみを使用して、セッションが区分に分割される(プロセスステップ1208)。区分の中のピークを含むフレームが、その区分を代表するキーフレームとなるように選択される。
【0102】
2.3.6.2 イメージ再構成
フレームが選択されると、その時点でホワイトボードが呈していた様相に対応するイメージを再構成する必要がある。ただし、入力シーケンスからの生のイメージを単に使用することはできない。というのは、生のイメージは、前景オブジェクトを含む可能性があるためである。イメージは、フレーム内のセルイメージを集めることによって再構成される。図13を参照すると、セルイメージに分割されたフレーム、およびセルイメージに分割されたキーフレームが入力されている(プロセスステップ1302)。セル分類に応じて3つのケースが存在する。
【0103】
1.キーフレームセルイメージがホワイトボードまたはストロークである場合、そのホワイトボードまたはストロークのイメージ自体が使用される(プロセスステップ1304、1306)。
【0104】
2.キーフレーム前景セルイメージが、ストロークの範囲内にある場合(すなわち、人物が、ボード上のストロークを覆い隠している。これは、解析段階中に時間的にフィルタにかけることで判定される)、そのセルイメージは、隣接するフレームからのストロークセルイメージで置き換えられる(プロセス1308、1310)。
【0105】
3.それ以外の場合、プロセスステップ1312および1314に示すとおり、前景オブジェクトが、そのセル内のホワイトボード背景を覆っているはずであり、前述したとおり計算されたホワイトボードの色で埋められる。
【0106】
2.3.7 キーフレームカラーバランス
再構成プロセスにより、ホワイトボードイメージから人物が除去されるが、それでもイメージは、入力シーケンスからの生のイメージのように見える。すなわち、グレーがかっていて、ノイズが多い。イメージにカラーバランス処理を行ってより良好なイメージを生成することができる。このプロセスは、図14のとおり以下の2つのステップから成る。
【0107】
1.背景を一様に白くして、ペンストロークの色の彩度を高める。各セルに関して、前述したとおり計算されたホワイトボードの色、
【0108】
【数20】
Figure 2004080750
【0109】
を使用してセル内の各画素の色を調整する。
【0110】
【数21】
Figure 2004080750
【0111】
である(プロセスステップ1402)。
【0112】
2.イメージノイズを低減する。キーフレームの中の各画素の各色チャネルの値をS字型の曲線に従ってマップしなおす(プロセスステップ1404)。255/2より低い光度を0の方にスケールダウン(scale down)し、255/2より高い光度を255の方にスケールアップ(scale up)する。
【0113】
区分の開始時刻および終了時刻、および区分のキーフレームイメージのファイル名が、ストロークのタイムスタンプとともにインデックスに保存される。ストロークのタイムスタンプは、そのストロークが出現する最初のフレームである。この情報は、セクション2.3.3で計算済みである。
【0114】
2.4 ブラウザの動作およびユーザインターフェース
2.4.1 概要
アナリシスサーバは、イメージシーケンスを処理して、インデックスおよびキーフレームイメージを生成した後、処理済みの記録に対するURLを伴う電子メールを登録済みのセッション参加者に送信する。ユーザは、そのURLをクリックしてブラウズソフトウェアを立ち上げる。ブラウズソフトウェアの目的は、ユーザが、キーフレームイメージを閲覧することができ、特定のトピックに関連する音声に迅速にアクセスできるようにすることである。
【0115】
ブラウズソフトウェアのユーザインターフェース(UI)を図15に示している。UIの主要な領域は、キーフレームサムネール1502(キーフレームイメージのグラフィックス表示)が表示されるキーフレームペイン1504、並びにカメラからの生のイメージ1512、および現行のキーフレームイメージ1502の合成を示すブラウザのメイン表示ペインを含む。また、キーフレームペイン1504には、ユーザが、メイン表示ペイン内に表示されたイメージを調整して生の入力イメージからキーフレームイメージにすることを可能にする背景透明スライダも組み込まれている。会議再生タイムラインにおいて既に書き込まれているストロークである現行のペンストローク1510が、会議再生タイムラインにおいてまだ書き込まれていない将来のストローク1508よりも濃く、より明確にメイン表示ペイン内でレンダリングされる。参加者が将来に書き込むことになるペンストローク1508は、ゴーストのようなスタイルで示される。この映像化の技法は、後により詳細に説明する。
【0116】
VCR−標準タイムラインコントロール1514が、メイン表示ペイン1506の下でブラウザUIの左下隅に提供される。VCR−標準タイムラインコントロール1514により、ユーザは、通常のビデオカセットレコーダ(VCR)上に見られるコントロールと同じように、イメージ/音声シーケンスをゆっくりと、または迅速に戻すこと、または先に進めること、または停止させることが可能になる。タイムラインバー1518が、音声/イメージシーケンスの長さをバーとしてグラフィックスで表示し、会議再生の開始時刻、終了時刻、および現在時刻の数値を提供する。このバー1518の上のポインタ1520を選択し、前後にドラッグして、イメージ/音声シーケンスを直線的に先に進めること、および戻すことができる。
【0117】
前述したUI要素のいくつかの場所を提示しているが、これは限定することを意図するものではないことに留意されたい。以上のUI要素は、ディスプレイ上の任意の場所に、単独で、または他の要素と組み合わせて提供することが可能である。
【0118】
2.4.2 会議データに対する非線形アクセス
記録済みの音声に対する2つのレベルの非線形アクセスが、ビジュアルのインデックス付けのコンテキストで提供されている。
【0119】
第1のレベルの非線形アクセスは、キーフレームサムネール1502の使用を介するものである。各キーフレームサムネールには、ディスプレイ上である時間範囲が関連付けられている。ユーザは、キーフレームサムネールをクリックして、対応するキーフレームに関する音声の開始ポイント(例えば、区分の先頭)にジャンプすることができる。
【0120】
記録済みの音声に対する第2のレベルのアクセスは、各キーフレーム内のペンストロークの使用を介するものである。カーソルが、メインウインドウ1506内でペンストロークセル(現行のストローク1510または将来のストローク1508)の上を行き来しているとき、そのカーソルは、そのセルが選択可能(例えば、マウスで「クリック可能」)であることを示す「手」の記号に変化する。マウスまたは他の入力デバイスでそのセルをダブルクリックすることにより、アプリケーションが音声再生モードにされる。再生は、クリックされたストロークセルが書き込まれたセッションの時点から開始する。クリックされたストロークが書き込まれた時点は、シーケンスの中で同一のパターンのセルイメージが出現した最も早期の時点である。メインウインドウは、その時点でイメージを示すことを開始する。ユーザは、それでも、他のストロークセルをクリックしてセッションの別の部分にジャンプすることができる。
【0121】
VCR−標準タイムラインコントロール1514と併せて、以上の2つのレベルのビジュアル式インデックス付けにより、ユーザは、非常に効率的な仕方で会議をブラウズすることが可能になる。
【0122】
2.4.3 イメージビューイング
図15に示すとおり、キーフレームイメージのサムネール(例えば、1502)が、キーフレームペイン1504内にリストされる。サムネール1502の1つをマウスのカーソルまたはその他の入力デバイスで選択することにより、対応するキーフレームイメージが、左側でメインウインドウ1506にもたらされ、アプリケーションが、イメージビューイングモードにされ、このモードで、ユーザは、ズーム制御ボタン1522を使用してズームインおよびズームアウトを行うこと、イメージの中のテキストおよび図を読み取ること、またはイメージの一部分を他のドキュメントにカットアンドペーストしてすることができる。さらに、キーフレーム全体を他のドキュメントにカットアンドペーストすること、またはメモとして印刷することが可能である。
【0123】
2.4.4 ホワイトボードの内容の映像化
キーフレームイメージおよびタイムスタンプ情報を所与として、任意の所与の時点におけるホワイトボードの内容に対応するイメージを再構成することができる。毎フレームのイメージが、タイムラインコントロール1514を使用する音声再生時刻に従ってレンダリングされた場合、メインウインドウは、ホワイトボードの内容を映画のように再生する。この手法を使用することで、ユーザは、セッションに対する聴覚のコンテキストと視覚のコンテキストをともに有する。ただし、ユーザは、ユーザを先の時刻に進めるペンストローク(将来のストローク1508)をクリックすることはできない。というのは、そのストロークが、メインウインドウ内でまだレンダリングされていないからである。
【0124】
本ホワイトボードキャプチャシステムの初期の実施形態では、将来のストロークは、色あせた(washed out)モードで示されていた。しかし、短い試用期間の後、ブラウザのユーザは、しばしば、将来のストロークをきれいに消去されていないストロークと混同した。このインターフェースに関する別の苦情は、ユーザは、手前に人物のいないホワイトボードイメージを好んだが、ときとして、誰がストロークを書き込んだかを知ることを望んだということである。
【0125】
数回の設計を繰り返した後、前述した懸念のすべてに対処する図16に示した以下の映像化プロセスが決められた。このプロセスのプロセスステップは、以下のとおりである。
【0126】
1.現行の区分のキーフレームイメージおよびタイムスタンプ情報を使用して現行のホワイトボードの内容をレンダリングする(プロセスステップ1602)。
【0127】
2.将来のストロークをレンダリングし、結果をグレースケールに変換し、ガウスフィルタを使用してぼかす(プロセスステップ1604)。
【0128】
3.ステップ1およびステップ2からのイメージを合わせる(プロセスステップ1606)。
【0129】
4.ステップ3からのイメージを入力シーケンスからの修正済みのイメージにアルファブレンドする(プロセスステップ1608)。修正済みのイメージは、入力シーケンスからの対応するイメージ(図4に示した)であるが、ホワイトボードでない領域がトリミングされた後、長方形の形状にマップしなおされたものである。ユーザは、レンダリングされたキーフレームホワイトボードイメージだけを示す0から、元の修正済みイメージそのものを示す1まで、GUIスライダ(図15の1516)を使用してアルファ値を制御することができる。レンダリングされたキーフレームホワイトボードイメージは、前景オブジェクトが除去され、前景オブジェクトが遮っていたストロークで置き換えられたキーフレームイメージである。
【0130】
以上は、1)現在のストロークと将来のストロークがともに、レンダリングされたホワイトボードイメージ上に示され、ユーザが、過去にジャンプして戻ることも、将来にジャンプして進むこともできるようにするため、また2)修正済み入力イメージをキーフレームと融合させることにより、前景オブジェクトが追加されて、より多くのコンテキストが与えられるため、非常に有用な映像化の仕方であると考えられる。アルファ=0.8を使用するそのような映像化の例に関して、図15を参照されたい。
【0131】
2.5 セキュリティ
会議参加者は、機密に関わる情報が意図しない人々によって見られる可能性があるため、会議を記録することに関して、通常、危惧の念を抱いている。会議参加者には、記録されたデータをセキュアに保つことは、懸念すべき問題である。この問題に対処するため、簡単なトークンベースのアクセスセキュリティモデルが開発された。このプロセスのプロセスステップを図17に示している。
【0132】
本ホワイトボードキャプチャシステムでは、会議参加者は、会議記録の開始時にキャプチャソフトウェアに登録するように求められる(プロセスステップ1702)。会議参加者は、コンピュータスクリーン上のダイアログボックスの中で自らの電子メールの別名を記入するか、またはプロセスをスピードアップするため、自らの企業IDカードをスマートカード読取装置に挿入して登録することができる。
【0133】
すべての記録済みセッションは、Webサーバ上に存在する。誰も登録しなかった場合、会議は、公衆アクセス可能なWebページ上に掲示される(プロセスステップ1704、1706)。少なくとも1名の参加者が登録した場合、会議の記録および解析の後、アクセストークンが生成される(プロセスステップ1708)。トークンは、固有の会議識別子を含む長いランダムに生成されたストリングである。トークンを含むURLが、登録済み参加者に電子メールで送信される(プロセスステップ1710)。受け手は、そのURLに行ってWebブラウズソフトウェアを立ち上げて会議を綿密に見る(1712)。また、受け手は、そのURLを会議に出席しなかった人々に転送することもできる。
【0134】
この簡単な隠蔽によるセキュリティ(Security by Obscurity)モデルは、うまく機能するようである。ただし、その他のセキュリティ対策を使用することも可能である。
【0135】
本ホワイトボードキャプチャシステムの前述したセキュリティ機構に加えて、会議を記録している間のプライバシーモデルも用意されている。会議参加者が、記録されることを望まないことを何か言った、または書いた場合、前の15秒(別の所定の期間を使用することも可能であるが)のイメージと音声データの両方を消去する機構が存在する。この消去は、物理的なボタン、またはGUIのボタンを押すことによって開始される。
【0136】
2.6 代替の実施形態
前述した基本的なホワイトボードキャプチャシステムを多数の他の技術およびデバイスと組み合わせて代替の実施形態を提供することが可能である。以下に述べる様々な実施形態は、単独で、または組合せで使用することが可能である。
【0137】
1つのそのような実施形態では、キーフレームに対して従来の光学式文字認識(OCR)を行って、ドキュメントまたはプレゼンテーションビューグラフを作成するのに容易に使用される編集可能なテキストが提供される。
【0138】
別の実施形態では、従来の音声認識ソフトウェアを使用してキャプチャされたデータの音声部分がテキストに変換される。これにより、会議議事録およびその他のドキュメントの容易な作成が可能になる。また、会議情報を聴覚障害者に提供する比較的安価なやり方も提供される。
【0139】
また、本ホワイトボードキャプチャシステムは、例えば、三脚上のマイクロホンおよびカメラを備えたノートブックコンピュータを使用することによってポータブルにすることができる。この構成は、ホワイトボードに対するカメラの位置を決める追加の初期較正だけを必要とする。この較正は、イメージの中のパネルの4つの隅を手作業で決めることによって手作業で、またはエッジ検出などの従来の方法を使用することによって自動的に行うことが可能である。
【0140】
また、本ホワイトボードキャプチャシステムの解析ソフトウェアを使用して、ホワイトボードの内容を推定するのにペン追跡を使用するホワイトボードキャプチャシステムでキーフレームを決定することも可能である。ペン座標の履歴は、通常、そのシステムにおいてベクトル形式でキャプチャされるので、任意の所与の時点におけるホワイトボード上の内容を後に再構成することができる。そのようなシステムで本ホワイトボードキャプチャシステムの解析ソフトウェアを使用することにより、解析プロセスが単純化される。セルイメージは、ストロークまたはホワイトボードであるため、ホワイトボード背景色の判定、またはホワイトボード領域修正は必要なく、空間的および時間的にフィルタにかけることも必要なく、またホワイトボードセルの分類もより簡単である。というのは、ホワイトボード上に書き込まれたテキストを妨げる前景オブジェクトが存在しないからである。次に、セル「イメージ」が、ホワイトボード領域上のペン位置で推定された内容から導出される。本発明のこの実施形態は、基本的に、図5のプロセスステップ506で述べたとおり、セル「イメージ」をクラスタ化し、前景セルが存在しないことを除けば、プロセスステップ508と同様に各セルをストロークまたはホワイトボードセルとして分類し、その分類結果を使用してキーフレームイメージを抽出する(プロセスステップ512)。その結果を低帯域幅および小さいストーレッジの要件で伝送し、アーカイブすることができる。さらに、この実施形態でも、OCRを使用してキャプチャ済みのキーフレームを複写することが可能である。
【0141】
さらに、本ホワイトボードキャプチャシステムの実用の実施形態では、システムのフレームレートは、市販のスチールカメラのフレームレートによって制限される。より高いフレームレートを実現するため、HDTVカメラなどの高解像度ビデオカメラを使用することが可能である。
【0142】
さらに別の実施形態では、本ホワイトボードキャプチャシステムは、ジェスチャ認識を組み込んでジェスチャコマンドを使用する。例えば、ホワイトボード上のどこかにコマンドボックスが書き込まれていることが可能である。ユーザが動いたとき、またはボックスを指し示したとき、システムは、ジェスチャ認識を使用してそのジェスチャが行われた特定の時刻におけるイメージにタイムスタンプを付ける。
【0143】
基本的な適用例では、解析プロセスは、ホワイトボード背景色が、入力シーケンスの中で一定であるものと想定している。ただし、誰によってもカメラから隠される可能性がないホワイトボードの最上部に既知の色パッチを取り付けることができる。ソフトウェアは、この容易に検出可能なパッチの既知の色特性に基づき、フレームごとに異なる照明条件に合わせてカメラ露出パラメータを調整することができる。これは、次のとおり行われる。露出パラメータが一定のままである場合、室内の異なる照明条件でキャプチャされたイメージにおいてパッチの色が異なる可能性がある。カメラは、前のフレームの中でパッチがどのような色であるかということから、露出パラメータを調整することができる。パッチの色が指定された範囲内にとどまり、ホワイトボード領域も同様であることが可能である。
【0144】
3.0 システムのパフォーマンスおよび使用
3.1 背景
本ホワイトボードキャプチャシステムの設計目標は、本ホワイトボードキャプチャシステムが、1)任意の既存のホワイトボードで機能し、2)ホワイトボードの内容を自動的に信頼の置けるようにキャプチャし、3)ホワイトボードの内容をビジュアル式インデックスとして使用して、本システムを使用して記録された会議を効率的にブラウズすることである。
【0145】
感知機構または電子ホワイトボードを使用するホワイトボードキャプチャシステムと比べて、本ホワイトボードキャプチャシステムは、1組の独特な技術的課題も有している。第1に、ホワイトボード背景色は、通常、あらかじめ較正されない(例えば、空白のホワイトボードの写真を撮影することにより)。というのは、各部屋が、セッションごとに異なる可能性があるいくつかの照明セッティングを有するからである。第2に、しばしば、人々は、デジタルカメラとホワイトボードの間で動き、この前景オブジェクトが、ホワイトボードのいくらかの部分を覆い隠し、ホワイトボード上に影を落とす。シーケンスの中で、全く覆い隠されていないフレームが存在しない可能性がある。タイムスタンプを計算し、キーフレームを抽出するため、以上の問題に対処しなければならなかった。
【0146】
3.2 システム構成要素
本ホワイトボードキャプチャシステムの設計中、試作品のシステムを構築し、繰り返し改良を行った。3つの会議室に本ホワイトボードキャプチャシステムを備えた。この3つの部屋に関する情報を以下のテーブル1にリストしている。サンプルイメージ(ボード上で80×80画素、およそ96ポイントのフォント)を図18Aに示している(イメージはそれぞれ、左から右に、部屋1、部屋2、および部屋3に対応する)。
【0147】
【表1】
Figure 2004080750
【0148】
以上の部屋内のホワイトボードのサイズは異なり、生成されたキーフレームイメージの品質も異なっていた。サンプルイメージ(図18A)から見て取ることができるとおり、12’×5’(366センチメートル×152センチメートル)のボード上の書込みは、4メガピクセルの入力イメージで解像度が限度に達したため、その他の2つのボード上の書込みよりも不明瞭である(一番右)。それでも、その書込みは、やはり極めて読みやすい。12’×5’(366センチメートル×152センチメートル)のホワイトボードを使用するセッションからのいくつかの選択されたフレーム(図18B)、および対応するキーフレームイメージ(図18Cおよび18D)も示している。
【0149】
本システムは、特殊なペンおよびイレーザを必要とすることなしに、任意の既存のホワイトボードで機能しなければならないので、ホワイトボードの内容をキャプチャするのに、直接キャプチャデバイスであるスチールカメラが選択された。本ホワイトボードキャプチャシステムの例示的な実用の実施形態では、4メガピクセルを有するキャノン(登録商標)PowerShot G2デジタルスチールカメラが使用された。このカメラは、2272画素×1704画素、つまり6’×4’(183センチメートル×121センチメートル)のボードの場合、31.6dpiに等しいイメージを提供する。このカメラが選択された1つの重要な理由は、PCからカメラを制御するようにカスタマイズされたソフトウェアソリューションを書くことを可能にするソフトウェア開発キットが入手できることである。このソフトウェアは、実質的にすべてのカメラパラメータをショットごとに指定することを可能にする。本システムは、ホワイトボードの写真を直接に撮影するので、ペンストロークの位置ずれは存在しない。ユーザが、消去を行う前にシステムをオンにする限り、内容は保存される。
【0150】
アナリシスサーバは、ペンティアム(登録商標)III 800MHzのデュアルCPU PC上で動作する。解析プロセスは、セッション時間の毎時間におよそ20分間かかる。16ビット11KHzのモノラルの音声に関する記憶要件は、MP3符号化を使用しておよそ毎時15Mbを要する。入力イメージシーケンスは、モーションJPEG圧縮を使用しておよそ毎時間34Mbを要する。
【0151】
3つの会議室内に設置されたシステムは、様々なチームによって頻繁に使用された。6カ月の間に、合計48時間の108回のセッションが記録された。すなわち、平均して1回のセッション当り27分間であり、1週間当り4.5回のセッションになる。1回のセッション当りのキーフレームの平均数は、2.7であった。キーフレームイメージは、JPEG形式で保存した。平均イメージサイズは、51.8Kbであった。サイズは、17Kbから150Kbまでの範囲内にあった。JPEG圧縮は、一様に白い背景に対して極めてよく機能したため、イメージサイズは、イメージの寸法よりも、どれだけ多くユーザがボード上に書込みを行ったかの方により強く関連していた。
【0152】
本システムのすべてのユーザが、本システムは、ホワイトボードを頻繁に使用する会議に非常に役立つと考えた。キーフレームイメージ、およびビジュアル式インデックス付けの機能により、参加者が、後の時点で会議を綿密に見る(review)ことができるようになるだけでなく、会議に出席しなかったユーザが、実際の会議時間の数分の1の時間で会議の要点を理解することができるようになる。
【0153】
一部のユーザは、当初、意図されていなかった本システムの新しい用途を見出した。ホワイトボード上に書き込むことを通常、必要としなかった旧態依然の会議(status meeting)を例にとろう。人々は、やはり、ホワイトボードキャプチャシステムをオンにした。誰かが発言する順番になったとき、主任が、その人の名前をボード上に書き込んで、その発言のセグメントを後に記録された音声の中で、そのキーフレームイメージの中の名前をクリックすることによって容易に見出すことができるようにした。別の例は、ブレーンストーミングセッション中であり、誰かが、よい考えを思い付いたとき、その人が、ボードの脇に星印を書き込み、その考えを声に出して言った。音声は、後にその星印をクリックすることによって取り出すことができる。
【0154】
本発明の以上の説明は、例示および説明の目的で提示した。以上の説明は、すべてを網羅する、または本発明を開示した形態そのものに限定することを意図するものではない。以上の教示に鑑みて、多数の変更形態および変形形態が可能である。本発明の範囲は、以上の詳細な説明によってではなく、本明細書に頭記の特許請求の範囲によって限定されるものとする。
【0155】
付録:平面ベースのホワイトボードの色の推定
カラーイメージの1つの成分だけを考慮するが、以下に説明する技法は、すべての成分(R、G、B、またはY)に適用される。各セルiが、イメージ座標(x,y)で定義される。セルの色は、z(z=R、G、B、またはY)で指定される。色は、セクション2.3.2に説明したとおり計算され、したがって、ノイズが多く、誤りさえある。会議室での体験では、ホワイトボードの色は、しばしば、一様ではない。ホワイトボードの色は、通常、上部ではるかに明るく、下部に向かって暗くなるか、あるいは上隅の1つではるかに明るく、反対側の下隅に向かって暗くなる。これは、照明が天井に対して設置されているためである。したがって、ある局所領域(例えば、7×7セル)に関して、平面を色に正確に適合させることができ、イメージ全体に関して、平面の適合(plane fitting)はそれでも、非常に適切であり、セルの色が外れ値であるかどうかの堅牢な指示を提供する。
【0156】
平面は、ax+by+c−z=0で表わすことができる。ziにだけノイズを有する1組の3Dポイント{(xi,yi,zi)|i=1,...n}が与えられる。平面パラメータp=[a,b,c]は、次の目的関数を最小化することによって推定することができる。
【0157】
【数22】
Figure 2004080750
【0158】
ただし、f=ax+by+c−zである。最小2乗の解が、以下のとおり与えられる。
【0159】
p=(AA)−1z、
ただし、
【0160】
【数23】
Figure 2004080750
【0161】
であり、かつz=[z1,...zn]である。平面パラメータが決まると、セルiの色を
【0162】
【数24】
Figure 2004080750
【0163】
で置き換える。
【0164】
最小2乗法は、誤りのあるデータ(外れ値)に対して堅牢ではない。前述したとおり、最初に計算されたホワイトボードの色は、外れ値を含まない。外れ値を検出し、拒否するため、平面をホワイトボードイメージ全体に適合させる堅牢な技法を使用する。データの半分近くが外れ値であることを許容することができる非常に堅牢な技法である最小2乗平均法[11]を使用する。考え方は、2乗された誤りの総和ではなく、中央値を最小化することによってパラメータ、すなわち、
【0165】
【数25】
Figure 2004080750
【0166】
を推定することである。3つのポイントの最初のm個のランダムなサブサンプルが取られる(3は、平面を定義する最小数である)。各サブサンプルにより、平面の推定値が与えられる。数mは、m個のサブサンプルの少なくとも1つが良好である確率が1に近く、例えば、99%になるだけ十分に大きくなければならない。データの半分が外れ値である可能性があるものと想定した場合、m=35であり、したがって、ランダムなサンプリングを非常に効率的に行うことができる。各サブサンプルに関して、平面パラメータ、および2乗された誤り
【0167】
【数26】
Figure 2004080750
【0168】
の中央値を計算する。Mで表わされる2乗された誤りの最小中央値を与える平面パラメータが保持される。次に、いわゆる堅牢な標準偏差
【0169】
【数27】
Figure 2004080750
【0170】
(この係数を使用して、外れ値が存在しないときと同じ効率が実現される)を計算する。ポイントiは、ポイントiの誤りが|f|>2.5σである場合、外れ値と見なし、廃棄する。最後に、前述した最小2乗法を使用してその良好なポイントに平面を適合させる。外れ値のセルiの色を
【0171】
【数28】
Figure 2004080750
【0172】
で置き換える。
【図面の簡単な説明】
【図1】本発明を実施するための例示的なシステムを構成する汎用コンピューティングデバイスを描いた図である。
【図2】本ホワイトボードキャプチャシステムの3つの主な構成要素、すなわち、キャプチャユニット、アナリシスサーバ、およびブラウズソフトウェアを描いている、試作品のホワイトボードキャプチャシステムを使用してキャプチャされた図である。
【図3】本発明によるホワイトボードキャプチャシステムを示す概略図である。
【図4】入力イメージシーケンスからの選択されたフレームを示すイメージシーケンスを示す図である。
【図5】本発明によるシステムおよび方法のイメージ解析プロセスを描いた流れ図である。
【図6A】ホワイトボードの色を計算する第1の技術を示す図である。
【図6B】ホワイトボードの色を計算する第2の技術を示す図である。
【図7】左側のイメージが、ホワイトボードの色を計算する第1の戦略の結果であり、中央のイメージが、ホワイトボードの色を計算する第2の戦略の結果であり、また右側のイメージが、実際の空白のホワイトボードイメージを示しているホワイトボード色抽出結果を示すイメージシーケンスを示す図である。
【図8】本発明によるシステムおよび方法のセル分類プロセスを描いた流れ図である。
【図9】上のイメージが、トリミングおよび修正の後の図5のイメージに対応する分類結果の一連のサンプルを示す図である。
【図10】図4のシーケンスに関するストローク数対時間のプロットを示す図である。
【図11】入力イメージのシーケンスからキーフレームを選択するのに使用される一般的なプロセスを描いた流れ図である。
【図12】本発明によるシステムおよび方法において区分およびキーフレームを識別するプロセスを描いた流れ図である。
【図13】本発明によるシステムおよび方法においてキーフレームイメージを再構成するプロセスを描いた流れ図である。
【図14】本発明によるシステムおよび方法においてキーフレームイメージのカラーバランス処理を行うプロセスを描いた流れ図である。
【図15】各キーフレームイメージが、記録の中の重要な時点のホワイトボードの内容を代表する、本ホワイトボードキャプチャシステムのブラウザインターフェースを描いたイメージを示す図である。
【図16】本発明によるシステムおよび方法における現在のペンストロークおよび将来のペンストロークを表示するプロセスを描いた流れ図である。
【図17】本発明によるシステムおよび方法において使用されるセキュリティ処理を描いた流れ図である。
【図18A】本発明の実用の実施形態の3つの設置場所において取り込まれたホワイトボードの内容のサンプルイメージを提供する図である。
【図18B】本発明の実用の実施形態の入力キーフレームイメージを描いた図である。
【図18C】本発明の実用の実施形態の出力キーフレームイメージを描いた図である。
【図18D】本発明の実用の実施形態の出力キーフレームイメージを描いた図である。
【符号の説明】
120 処理ユニット
121 システムバス
130 システムメモリ
134 オペレーティングシステム
135 アプリケーションプログラム
136 他のプログラムモジュール
137 プログラムデータ
140 取外し不可能な不揮発性メモリのインターフェース
144 オペレーティングシステム
145 アプリケーションプログラム
146 他のプログラムモジュール
147 プログラムデータ
150 取外し可能な不揮発性メモリのインターフェース
160 ユーザ入力インターフェース
161 マウス
162 キーボード
170 ネットワークインターフェース
171 ローカルエリアネットワーク
172 モデム
173 ワイドエリアネットワーク
180 リモートコンピュータ
185 リモートアプリケーションプログラム
190 ビデオインターフェース
191 モニタ
192 カメラ
194 カメラインターフェース
195 出力周辺インターフェース
196 プリンタ
197 スピーカ
202 キャプチャユニット
204 アナリシス/処理サーバ
206 ブラウズソフトウェア
1502 キーフレームサムネール
1508 将来のストローク
1510 現在のストローク
1512 生のイメージ
1514 VCR−タイムラインコントロール

Claims (82)

  1. オーディオビジュアルの内容を要約し、インデックスを付けるためのプロセスであって、
    電子式でないホワイトボードに書き込まれた内容のイメージシーケンスをカメラを使用してキャプチャするプロセス動作と、
    前記イメージシーケンスに相関する音声信号を記録するプロセス動作と、
    前記イメージシーケンスを解析して前記ホワイトボードの内容の重要なポイントを要約するキーフレームを分離するプロセス動作
    を含むことを特徴とするプロセス。
  2. 前記記録された音声信号を前記キーフレームに相関させるプロセス動作をさらに含むことを特徴とする請求項1に記載のプロセス。
  3. 前記音声信号が、前記記録された音声信号と前記イメージシーケンスの両方に付けられたタイムスタンプで前記イメージシーケンスに相関させられることを特徴とする請求項2に記載のプロセス。
  4. 前記音声信号を前記イメージシーケンスと相関させることは、
    前記イメージシーケンスがキャプチャされた時刻に共通クロックで前記イメージシーケンスにタイムスタンプを付けることと、
    前記音声信号が記録された時刻に共通クロックで前記音声信号にタイムスタンプを付けることと、
    前記共通クロックの前記タイムスタンプを使用して前記イメージシーケンスと前記音声信号を相関させること
    を含むことを特徴とする請求項3に記載のプロセス。
  5. 前記イメージシーケンスの中の所望のポイントで前記イメージシーケンス、および前記相関させられた前記音声信号にアクセスすることをさらに含むことを特徴とする請求項3に記載のプロセス。
  6. 前記キーフレームは、前記イメージシーケンスの中の前記所望のポイントを選択するのに使用されることを特徴とする請求項5に記載のプロセス。
  7. 前記解析するプロセス動作は、
    前記イメージシーケンスの中のすべてのイメージ内の前記ホワイトボードのビューを修正するプロセス動作と、
    ホワイトボード背景色を抽出するプロセス動作と、
    セルイメージをそれぞれが表わすセルに前記イメージシーケンスの各イメージを分割するプロセス動作と、
    時間にわたる各セルに関する前記イメージシーケンス全体のセルイメージをクラスタ化するプロセス動作と、
    各セルイメージをストローク、前景オブジェクト、またはホワイトボードセルとして分類するプロセス動作と、
    当該分類結果を使用してキーフレームイメージを抽出するプロセス動作
    を含むことを特徴とする請求項1に記載のプロセス。
  8. セルイメージを空間的にフィルタにかけて分類結果を精密にするプロセス動作をさらに含むことを特徴とする請求項7に記載のプロセス。
  9. 前記セルイメージを時間的にフィルタにかけて分類結果を精密にするプロセス動作をさらに含むことを特徴とする請求項7に記載のプロセス。
  10. 前記キーフレームイメージにカラーバランス処理を行ってイメージ品質を向上させることをさらに含むことを特徴とする請求項7に記載のプロセス。
  11. 前記ホワイトボードを修正するプロセス動作は、
    イメージ内の前記ホワイトボードの4つの隅を指定することと、
    各イメージのホワイトボードでない領域をトリミングすることと、
    バイキュービック補間を使用して各ホワイトボード領域に関する長方形の形状に対してバイリニアワープを行い、前記イメージシーケンスのそれぞれのキャプチャされたイメージ内でトリミングされ、修正されたホワイトボードイメージを獲得すること
    をさらに含むことを特徴とする請求項7に記載のプロセス。
  12. 前記ホワイトボード背景色を抽出するためのプロセス動作は、
    最も明るい輝度および最小の変動を有するホワイトボードセルを判別することと、
    ホワイトボードの色の中のホールを判別することと、
    前記ホールの周囲のホワイトボードセルを探索し、かつ、ホールでない最も近接したセルの色にカラー設定することによって各ホールを埋めること
    を含むことを特徴とする請求項7に記載のプロセス。
  13. 前記ホワイトボードの中のホールを判別するためのプロセス動作は、
    ホワイトボードセルである可能性がある色の範囲を指定するプロセス動作と、色の前記範囲外にあるかどうか各ホワイトボードセルを検査するプロセス動作と、
    前記範囲外の色を有するセルをホールとして指定するプロセス動作
    を含むことを特徴とする請求項7に記載のプロセス。
  14. 前記ホワイトボード背景色を抽出するプロセス動作は、
    ホワイトボードイメージ輝度のヒストグラムを作成することと、
    ピークのホワイトボード輝度を判定することと、
    ピークの輝度に対応する色を初期のホワイトボードの色として指定することと、
    誤りのあるデータを表わすホワイトボードの色の外れ値を判別することと、
    外れ値にホールとしてマークを付けることと、
    ホールの周囲のセルを探索し、ホールでない最も近接したセルの色にカラー設定することによって各ホールを埋めること
    を含むことを特徴とする請求項7に記載のプロセス。
  15. 各ホールを埋めた後、ホワイトボードのカラーイメージをフィルタリングすることをさらに含むことを特徴とする請求項14に記載のプロセス。
  16. 最小2乗平均法を使用して外れ値が検出されることを特徴とする請求項15に記載のプロセス。
  17. 前記最小2乗平均法は、
    2乗された誤りの中央値を最小化することによって輝度YまたはRGBの空間に平面を合わせるプロセス動作と、
    上記モデルに従わないセルを外れ値として指定するプロセス動作
    を含むことを特徴とする請求項16に記載のプロセス。
  18. 前記ホワイトボードのカラーイメージをフィルタリングすることは、平面をレッド、グリーン、ブルー(RGB)の色空間に合わせることを含むことを特徴とする請求項15に記載のプロセス。
  19. 前記セルに各イメージを分割するプロセス動作は、各イメージを長方形のセルに分割することを含むことを特徴とする請求項7に記載のプロセス。
  20. 前記セルに各イメージを分割するプロセス動作は、セルサイズが前記ホワイトボード上の単一の書き込まれた文字のサイズとほぼ同じサイズであるセルに各イメージを分割することを含むことを特徴とする請求項7に記載のプロセス。
  21. 前記セルのサイズは、前記ホワイトボードにおける縦1.5インチ(3.8センチメートル)、横1.5インチ(3.8センチメートル)の領域に対応することを特徴とする請求項20に記載のプロセス。
  22. 前記セルのサイズは、カメラ解像度およびホワイトボードサイズで決まることを特徴とする請求項19に記載のプロセス。
  23. 前記セルのサイズは、縦1画素、横1画素であることを特徴とする請求項15に記載のプロセス。
  24. 前記セルイメージをクラスタ化するプロセス動作は、時間を経て同じであると見なされるセルイメージをクラスタ化することを含むことを特徴とする請求項7に記載のプロセス。
  25. 前記時間を経て同じであると見なされるセルイメージをクラスタ化することは、正規化された相互相関法を使用して一度に2つのセルを比較することにより、セルイメージが同じであるかどうかを判定する動作を含むことを特徴とする請求項24に記載のプロセス。
  26. 前記相互相関のスコアは、2つのイメージが全く似通っていないことを表わす−1から、2つの全く同一のイメージを表わす1までの範囲内にあることを特徴とする請求項25に記載のプロセス。
  27. マハラノビス距離試験を適用して2つのセルが同じであるかどうかを判定するプロセス動作をさらに含むことを特徴とする請求項26に記載のプロセス。
  28. 前記マハラノビス距離試験は、
    Figure 2004080750
    によって与えられ、ただし、Iは、第1のセルイメージであり、かつ、I’は、第2のセルイメージであり、
    Figure 2004080750
    は、前記第1のセルイメージの平均の色であり、
    Figure 2004080750
    は、前記第2のセルイメージの平均の色であり、σは、
    Figure 2004080750
    からの標準偏差であり、かつ、σ’は、
    Figure 2004080750
    からの標準偏差であるプロセスであって、
    IおよびI’は、d<Tかつc>Tである場合にだけ、同一であると見なされ、かつ、1つの特定の実施形態では、T=2かつT=0.707であることを特徴とする請求項27に記載のプロセス。
  29. 前記各セルイメージを分類するプロセス動作は、
    RGB値がほぼ同一である場合、セルイメージをホワイトボードのセルとして指定することと、
    前記セルが大体において白またはグレーであり、1つまたは2つの原色が混じっている場合、セルイメージをストロークとして指定することと、
    セルイメージがホワイトボードセルの特性、またはストロークセルの特性を有さない場合、セルイメージを前景セルとして指定すること
    をさらに含むことを特徴とする請求項7に記載のプロセス。
  30. 前記各セルイメージを分類するプロセス動作は、
    現行のセルイメージの色分布を判定することと、
    対応するホワイトボードセルの色分布を判定することと、
    前記現行のセルイメージの前記色分布と前記対応するホワイトボードセルの色分布が同一であるか、同一ではないが強い類似性を有するか、または全く異なっているかを判定すること
    をさらに含むことを特徴とする請求項7に記載のプロセス。
  31. 前記セルイメージは、
    Figure 2004080750
    であり、かつ、σ/σ<Tσである場合にだけ、ホワイトボードセルとして分類され、ただし、
    Figure 2004080750
    は、ホワイトボードの色であり、σは、
    Figure 2004080750
    からの標準偏差であり、
    Figure 2004080750
    は、現行のセルの平均の色であり、かつ、σは、
    Figure 2004080750
    からの標準偏差であり、T=2かつTσ=2であり、それ以外の場合、前景オブジェクトセルとして分類されることを特徴とする請求項29に記載のプロセス。
  32. 前記セルイメージを空間的にフィルタにかけるプロセス動作は、
    孤立した前景セルを特定するプロセス動作と、
    孤立した前景セルをストロークセルとして分類しなおすプロセス動作と、
    前景セルに結合したストロークセルを特定するプロセス動作と、
    前景セルに結合した前記ストロークセルを前景セルとして分類しなおすプロセス動作
    を含むことを特徴とする請求項8に記載のプロセス。
  33. 前記セルイメージを空間的にフィルタにかけるプロセス動作は、
    時間にわたって各セルを評価して、前記各セルが、前景セルとして分類された前後に同一のストロークセルを含んでいたかどうかを判定するプロセス動作と、セルが、前景セルとして分類された前後に同一のストロークセルとして分類されていた場合に、前記セルをストロークセルとして分類するプロセス動作
    を含むことを特徴とする請求項9に記載のプロセス。
  34. 前記キーフレームイメージを抽出するプロセス動作は、
    前記分類結果を入力することと、
    前記イメージシーケンスの中の各フレームに関するストロークセルを計数することと、
    前記フレームに関する前記ストロークカウントを使用してストロークカウントのピークおよびくぼみを判定することと、
    それぞれの隣接するピークとくぼみの間の差が、所定のしきい値を超えた場合、くぼみとくぼみの間のデータを区分として指定し、各区分の中の前記ピークを前記区分を代表するキーフレームとして指定すること
    を含むことを特徴とする請求項7に記載のプロセス。
  35. 前記所定のしきい値は、合計のストロークカウントの20パーセントであることを特徴とする請求項34に記載のプロセス。
  36. 前記キーフレームイメージを再構成するプロセス動作をさらに含むことを特徴とする請求項34に記載のプロセス。
  37. 前記キーフレームイメージを再構成するプロセス動作は、前記イメージシーケンスの分類されたセルイメージ、およびセルイメージに分割されたキーフレームを入力するプロセス動作と、
    キーフレームセルイメージが、ホワイトボードイメージまたはストロークイメージとして分類された場合、ホワイトボードまたはストロークのイメージがレンダリングされるプロセス動作と、
    キーフレーム前景セルイメージが、ストロークの範囲内にある場合、そのセルイメージがシーケンスの中の隣接するイメージからのストロークセルイメージを使用してレンダリングされるプロセス動作と、
    前記キーフレームセルイメージが、ホワイトボードイメージとしても、ストロークイメージとしても、またはストロークの範囲内の前景セルとしても分類されない場合、ホワイトボードイメージとしてレンダリングされるプロセス動作
    をさらに含むことを特徴とする請求項36に記載のプロセス。
  38. 前記キーフレームイメージにカラーバランス処理を行ってイメージ品質を向上させることは、
    平均のホワイトボードの色を使用してセル内の各画素の色を調整することによって背景を一様に白くし、ペンストロークの色の彩度を高めるプロセス動作と、
    イメージノイズを低減するプロセス動作
    をさらに含むことを特徴とする請求項10に記載のプロセス。
  39. イベントデータを閲覧し、再生するためのグラフィカルユーザインターフェースであって、
    ホワイトボードに書き込まれた内容の生のイメージと、ホワイトボードに書き込まれた内容を要約するキーフレームイメージの合成を表示するメイン表示ペインを含むことを特徴とするグラフィカルユーザインターフェース。
  40. ホワイトボードに書き込まれた内容を要約する少なくとも1つのキーフレームイメージのグラフィックス表現をさらに含むことを特徴とする請求項39に記載のグラフィカルユーザインターフェース。
  41. 前記メイン表示ペイン内に表示された前記生のイメージは、ホワイトボードに書き込まれた内容を、記録済みのイメージタイムラインの再生を表わすイベント再生タイムラインにおける何らかのポイントで描き、かつ、前記キーフレームイメージは、ホワイトボードに書き込まれた内容を、イベント再生タイムラインにおいて前記生のイメージより後の何らかのポイントで表示することを特徴とする請求項39に記載のグラフィカルユーザインターフェース。
  42. 音声が、前記生のイメージに関連付けられ、かつ、キーフレームイメージが、前記内容が書き込まれた時刻に記録された関連する音声信号に相関させられることを特徴とする請求項41に記載のグラフィカルユーザインターフェース。
  43. ユーザが、前記メイン表示ペイン内に表示されたイメージ合成を調整して前記生の入力イメージから前記キーフレームイメージにすることを可能にする背景透明スライダコントロールをさらに含むことを特徴とする請求項41に記載のグラフィカルユーザインターフェース。
  44. イベント再生タイムラインにおいて既に書き込まれているストロークを表わす現在のペンストローク、および前記イベント再生タイムラインにおいてまだ書き込まれていないストロークを表わす将来のペンストロークを表示することをさらに含むことを特徴とする請求項41に記載のグラフィカルユーザインターフェース。
  45. 現在のペンストロークが、将来のストロークよりもより濃く、より明確にレンダリングされることを特徴とする請求項44に記載のグラフィカルユーザインターフェース。
  46. 前記イベント再生タイムラインにおいてまだ書き込まれていないストロークである将来のストロークが、ゴーストのようなスタイルで示されることを特徴とする請求項44に記載のグラフィカルユーザインターフェース。
  47. 前記イメージ合成は、
    所与の時刻におけるイメージ、およびタイムスタンプ情報を使用して現行のホワイトボードの内容の第1の修正されたイメージをレンダリングすることと、
    前記第1の修正されたイメージに対する将来のペンストロークの第2のキーフレームイメージをレンダリングし、前記将来のストロークをグレースケールに変換し、ガウスフィルタを使用して前記将来のペンストロークをぼかすことと、
    前記第1の修正されたイメージと前記第2のキーフレームイメージを合わせて合成イメージを獲得することと、
    前記合成イメージを入力シーケンスからの前記修正されたイメージにアルファブレンドしてアルファブレンドされた合成イメージを得ること
    によって決まることを特徴とする請求項39に記載のグラフィカルユーザインターフェース。
  48. ユーザが、スライダコントロールを使用して、アルファブレンドに使用されるアルファ値を制御することを可能とすることを特徴とする請求項47に記載のグラフィカルユーザインターフェース。
  49. ユーザが、キーフレームイメージだけが示される0から、元の修正されたイメージそのものが示される1まで前記スライダを動かすことを可能とすることを特徴とする請求項48に記載のグラフィカルユーザインターフェース。
  50. ユーザが、
    イベント再生タイムラインにおいて順に戻ること、
    イベント再生タイムラインにおいて順に進むこと、および、
    イベント再生タイムラインにおいて停止すること
    の少なくとも1つを行うことを可能とするVCR−標準タイムラインコントロールをさらに含むことを特徴とする請求項42に記載のグラフィカルユーザインターフェース。
  51. イベント再生タイムラインをバーとしてグラフィックス表示するタイムラインバーをさらに含むことを特徴とする請求項42に記載のグラフィカルユーザインターフェース。
  52. 前記イベントタイムライン再生の開始時刻の数値、終了時刻の数値、および現在時刻の数値をさらに含むことを特徴とする請求項51に記載のグラフィカルユーザインターフェース。
  53. 選択して、前記タイムラインバーに沿って前後にドラッグして、イメージおよび音声のシーケンスの中で直線的に順に進むこと、および順に戻ることが可能な前記タイムラインバー上のポインタをさらに含むことを特徴とする請求項52に記載のグラフィカルユーザインターフェース。
  54. ユーザは、前記キーフレームのサムネールを選択することによって会議再生タイムラインにおいてキーフレームイメージに対応する音声の開始ポイントにジャンプできることを特徴とする請求項42に記載のグラフィカルユーザインターフェース。
  55. ユーザは、現在のペンストロークまたは将来のペンストロークを選択することによって前記イベント再生タイムラインにおける現在のペンストロークまたは将来のペンストロークが書き込まれた時刻の対応する記録された音声にアクセスできることを特徴とする請求項42に記載のグラフィカルユーザインターフェース。
  56. 現在のペンストロークまたは将来のペンストロークが書き込まれた前記時刻は、その現在のペンストロークまたはその将来のペンストロークが出現した最早期の時刻であることを特徴とする請求項55に記載のグラフィカルユーザインターフェース。
  57. 入力デバイスのカーソルは、メインウインドウ内の現在のストロークまたは将来のストロークの上で行き来しているときに、前記現在のストロークまたは前記将来のストロークが選択可能であることを示す記号に変化することを特徴とする請求項55に記載のグラフィカルユーザインターフェース。
  58. キーフレームのサムネールを選択することにより、対応するキーフレームイメージが前記メイン表示ペインに表示されることを特徴とする請求項40に記載のグラフィカルユーザインターフェース。
  59. ユーザに、
    ズーム制御ボタンを使用してズームインおよびズームアウトを行うこと、
    前記メイン表示ペイン内に表示されたイメージ内のテキストおよび図を読み取ること、
    前記メイン表示ペイン内に表示されたイメージを印刷すること、
    前記メイン表示ペイン内に表示されたイメージの部分を他のドキュメントにカットアンドペーストすること
    の少なくとも1つを行うことを可能とすることを特徴とする請求項58に記載のグラフィカルユーザインターフェース。
  60. 会議の音声の内容および映像の内容をキャプチャするためのシステムであって、
    ホワイトボードに書き込まれたデータのイメージシーケンス、および会議中に生じたサウンドに対応する音声信号をキャプチャするキャプチャシステムと、
    前記ホワイトボードに書き込まれたキーデータフレームを抽出し、前記音声信号を前記キーデータフレームに相関させる、前記イメージシーケンスを解析するためのアナリシスサーバと、
    前記解析された会議キーデータフレーム、および相関させられた音声を閲覧するためのブラウズモジュール
    を含むことを特徴とするシステム。
  61. 前記キャプチャシステムは、
    イメージシーケンスをキャプチャするように配置されたカメラと、
    前記音声信号を記録するマイクロホンと、
    前記イメージシーケンスおよび前記音声信号を記録するためのコンピュータ
    をさらに含むことを特徴とする請求項60に記載のシステム。
  62. 前記カメラは、スチールカメラ、および、ビデオカメラの少なくともどちらかであることを特徴とする請求項61に記載のシステム。
  63. 前記カメラは、解像度を最大化するように可能な限り前記ホワイトボードに接近してズームインされることを特徴とする請求項61に記載のシステム。
  64. 前記カメラは、シーン深度を最小化するように可能な限り前記ホワイトボードに平行に揃えられることを特徴とする請求項61に記載のシステム。
  65. 前記アナリシスサーバは、前記キーデータフレームを、
    前記イメージシーケンスの中のすべてのイメージの中で前記ホワイトボードのビューを修正すること、
    ホワイトボード背景色を抽出すること、
    前記イメージシーケンスの各イメージをセルイメージのセルに分割すること、時間にわたって各セルに関して前記イメージシーケンス全体で似通っているセルイメージをクラスタ化すること、
    各セルイメージをストローク、前景オブジェクト、またはホワイトボードセルとして分類すること、および、
    前記分類結果を使用してキーフレームイメージを抽出すること
    によって特定することを特徴とする請求項60に記載のシステム。
  66. 前記アナリシスサーバは、前記キーデータフレームを、
    前記イメージシーケンスの中のすべてのイメージの中で前記ホワイトボードのビューを修正すること、
    ホワイトボード背景色を抽出すること、
    時間にわたって各セルに関して前記イメージシーケンス全体で似通っている画素をクラスタ化すること、
    各画素をストローク、前景オブジェクト、またはホワイトボードセルとして分類すること、および、
    前記分類結果を使用してキーフレームイメージを抽出すること
    によって特定することを特徴とする請求項60に記載のシステム。
  67. 記録が開始する前に、1名以上のユーザがキャプチャユニットにおいてユーザ識別子を登録し、
    少なくとも1名のユーザが、前記キャプチャユニットで登録した場合、前記アナリシスサーバはイベントの記録および解析の後にアクセストークンを生成し、前記アクセストークン、および解析された会議データのコンピュータメモリロケーションが前記登録されたユーザ識別子に提供され、さらに、
    前記1名以上のユーザが、前記解析されたイベントデータの前記コンピュータメモリロケーションにアクセスして前記解析された会議データを閲覧する
    ことを特徴とする請求項60に記載のシステム。
  68. 前記ユーザ識別子は電子メールアドレスであることを特徴とする請求項67に記載のシステム。
  69. 前記解析されたイベントデータの前記コンピュータメモリロケーションはインターネットWebサイトのアドレスであることを特徴とする請求項67に記載のシステム。
  70. 前記イメージシーケンスの部分、および、前記音声の部分の少なくともどちらかをユーザが消去することがかできるようにするプライバシー機構を前記キャプチャユニット内部にさらに含むことを特徴とする請求項60に記載のシステム。
  71. 前記プライバシー機構は、グラフィカルユーザインターフェースのボタン、または物理的ボタンを押すことによって起動されることを特徴とする請求項70に記載のシステム。
  72. 前記キャプチャシステムはポータブルであることを特徴とする請求項60に記載のシステム。
  73. イベントの内容を取り出すためのプロセスであって、
    電子式でないホワイトボードに書き込まれた内容のイメージシーケンスをカメラを使用してキャプチャするプロセス動作と、
    前記イメージシーケンスに相関する音声信号を記録するプロセス動作と、
    前記イメージシーケンスを解析して前記ボードの内容の要点を、
    前記イメージシーケンスの中の各イメージ内の前記ホワイトボードのビューを修正すること、
    ホワイトボード背景色を抽出すること、
    前記イメージシーケンスの各イメージをセルに分割すること、
    時間にわたって各セルに関して前記イメージシーケンス全体のセルイメージをクラスタ化すること、
    各セルイメージをストローク、前景オブジェクト、またはホワイトボードセルとして分類すること、および、
    前記分類結果を使用してキーフレームイメージを抽出すること
    によって要約するキーフレームを分離するプロセス動作
    を含むことを特徴とするプロセス。
  74. 前記解析して分離するプロセス動作は、光学式文字認識技術を使用してキーフレームイメージから編集可能なテキストを提供するプロセスステップをさらに含むことを特徴とする請求項73に記載のシステム。
  75. 前記解析して分離するプロセス動作は、音声認識技術を使用して音声をテキストに変換することをさらに含むことを特徴とする請求項73に記載のシステム。
  76. ジェスチャ認識技術を使用することをさらに含むことを特徴とする請求項73に記載のシステム。
  77. 前記キャプチャするプロセス動作は、
    既知の色特性を有する色パッチを前記ホワイトボードの上方に取り付けることと、
    前記イメージシーケンスの中のイメージ内で前記色パッチをキャプチャすることと、
    前記イメージ内の前記色パッチが示す色を判別することと、
    前記イメージシーケンスの中の次のイメージ内で前記色パッチをキャプチャすることと、
    前記次のイメージ内の前記色パッチが示す色を判別することと、
    前記パッチが示す色が前記イメージと前記次のイメージの間で所定のしきい値を超えて変化しているかどうかを判定することと、
    示された前記色が、前記しきい値を超えている場合に、設定されていたとすれば、前記次のイメージ内の前記色パッチの色を前記イメージ内で示される前記色パッチの色と一致させたであろう前記カメラの露出設定に、前記カメラの露出パラメータを調整すること
    をさらに含むことを特徴とする請求項73に記載のシステム。
  78. 前記調整することは、キャプチャされたすべてのイメージに対して行われることを特徴とする請求項77に記載のシステム。
  79. 会議の内容を取り出すためのシステムであって、
    ホワイトボードに書き込まれたデータシーケンスをキャプチャし、ペン位置を追跡してホワイトボードに書き込まれた内容を推定し、かつ、ホワイトボードに書き込まれた前記内容に相関する音声信号を記録するキャプチャシステムと、
    前記ホワイトボードに書き込まれたキーデータフレームを抽出し、前記音声信号を前記キーデータフレームに相関させるイメージシーケンスを解析するためのアナリシスサーバ
    を含むことを特徴とするシステム。
  80. 前記アナリシスサーバは、
    前記ホワイトボードの各領域をセルに分割する動作と、
    時間にわたって各セルに関して書き込まれた前記データシーケンス全体で同じであるセルをクラスタ化する動作と、
    各セルをストロークセルまたはホワイトボードセルとして分類すると、
    前記分類結果を使用してキーフレームイメージを抽出する動作
    を行うことを特徴とする請求項79に記載のシステム。
  81. 前記ホワイトボードセルは、1つの書き込まれた文字とほぼ同じサイズのセルに分割されることを特徴とする請求項80に記載のシステム。
  82. 会議中に記録されたデータに対する非線形アクセスを提供するためのコンピュータ実行可能命令を有するコンピュータ可読媒体であって、
    前記コンピュータ実行可能命令は、
    非電子式のワイトボードに書き込まれた内容のイメージシーケンスをカメラを使用してキャプチャするためのプログラムモジュールと、
    前記イメージシーケンスに相関する音声信号を記録するためのプログラムモジュールと、
    前記イメージシーケンスを解析して前記ホワイトボードの内容の要点を、
    前記イメージシーケンスの中の各イメージ内の前記ホワイトボードのビューを修正すること、
    ホワイトボード背景色を抽出すること、
    前記イメージシーケンスの各イメージをセルに分割すること、
    時間にわたって各セルに関して前記イメージシーケンス全体のセルイメージをクラスタ化すること
    各セルイメージをストローク、前景オブジェクト、またはホワイトボードセルとして分類すること、および、
    前記分類結果を使用してキーフレームイメージを抽出すること、
    によって要約するキーフレームを分離するためのプログラムモジュール
    を含むことを特徴とする媒体。
JP2003175464A 2002-06-19 2003-06-19 ホワイトボードおよび音声のキャプチャのためのシステムおよび方法 Expired - Fee Related JP4499380B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/178,443 US7260257B2 (en) 2002-06-19 2002-06-19 System and method for whiteboard and audio capture

Publications (3)

Publication Number Publication Date
JP2004080750A true JP2004080750A (ja) 2004-03-11
JP2004080750A5 JP2004080750A5 (ja) 2006-08-03
JP4499380B2 JP4499380B2 (ja) 2010-07-07

Family

ID=29734689

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003175464A Expired - Fee Related JP4499380B2 (ja) 2002-06-19 2003-06-19 ホワイトボードおよび音声のキャプチャのためのシステムおよび方法

Country Status (6)

Country Link
US (3) US7260257B2 (ja)
EP (1) EP1388794A3 (ja)
JP (1) JP4499380B2 (ja)
KR (1) KR100996787B1 (ja)
CN (1) CN1477590B (ja)
TW (1) TW200405260A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006178749A (ja) * 2004-12-22 2006-07-06 Fuji Xerox Co Ltd 情報処理装置、ネットワークシステム、方法、プログラム
US7898566B2 (en) 2005-08-22 2011-03-01 Canon Kabushiki Kaisha Video processing apparatus and object identifying method
US7991829B2 (en) 2006-05-31 2011-08-02 Fuji Xerox Co., Ltd. Electronic device, network connecting system, network connecting method, and program product therefor
JP2011524572A (ja) * 2008-06-14 2011-09-01 マイクロソフト コーポレーション マルチメディア会議イベント用のホワイトボード管理手法
JP2012119972A (ja) * 2010-12-01 2012-06-21 Ricoh Co Ltd 画像処理装置、及び画像処理プログラム
JP2012129990A (ja) * 2010-11-25 2012-07-05 Ricoh Co Ltd 画像処理装置、及び画像処理プログラム
JP2012134959A (ja) * 2010-11-29 2012-07-12 Ricoh Co Ltd 画像処理装置、及び画像処理プログラム
JP2012199911A (ja) * 2011-03-10 2012-10-18 Ricoh Co Ltd 情報処理装置
JP2013162341A (ja) * 2012-02-06 2013-08-19 Nippon Telegr & Teleph Corp <Ntt> チャプタ代表画像生成装置およびその動作方法
JP2015109612A (ja) * 2013-12-05 2015-06-11 キヤノン株式会社 画像音声再生システム及び画像音声再生方法とプログラム
WO2019065345A1 (ja) * 2017-09-28 2019-04-04 日本電気株式会社 録音再生システム、録音再生方法、録音装置、記録媒体および録画装置
CN110809769A (zh) * 2017-06-26 2020-02-18 哈德利公司 智能白板协作系统和方法

Families Citing this family (170)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4052498B2 (ja) 1999-10-29 2008-02-27 株式会社リコー 座標入力装置および方法
US7299405B1 (en) * 2000-03-08 2007-11-20 Ricoh Company, Ltd. Method and system for information management to facilitate the exchange of ideas during a collaborative effort
US7653925B2 (en) 1999-11-17 2010-01-26 Ricoh Company, Ltd. Techniques for receiving information during multimedia presentations and communicating the information
JP2001184161A (ja) 1999-12-27 2001-07-06 Ricoh Co Ltd 情報入力方法、情報入力装置、筆記入力装置、筆記データ管理方法、表示制御方法、携帯型電子筆記装置および記録媒体
ES2396587T3 (es) * 2000-07-05 2013-02-22 Smart Technologies Ulc Método y aparato táctil en base a cámara
US6803906B1 (en) * 2000-07-05 2004-10-12 Smart Technologies, Inc. Passive touch system and method of detecting user input
US6954197B2 (en) * 2002-11-15 2005-10-11 Smart Technologies Inc. Size/scale and orientation determination of a pointer in a camera-based touch system
JP4112968B2 (ja) * 2002-12-26 2008-07-02 富士通株式会社 ビデオテキスト処理装置
US20040153461A1 (en) * 2003-02-03 2004-08-05 Brown Mark L. System and method for collecting and disseminating information
US7629967B2 (en) 2003-02-14 2009-12-08 Next Holdings Limited Touch screen signal processing
US8456447B2 (en) 2003-02-14 2013-06-04 Next Holdings Limited Touch screen signal processing
US8508508B2 (en) 2003-02-14 2013-08-13 Next Holdings Limited Touch screen signal processing with single-point calibration
US7684624B2 (en) * 2003-03-03 2010-03-23 Smart Technologies Ulc System and method for capturing images of a target area on which information is recorded
US7532206B2 (en) 2003-03-11 2009-05-12 Smart Technologies Ulc System and method for differentiating between pointers used to contact touch surface
US7593546B2 (en) * 2003-03-11 2009-09-22 Hewlett-Packard Development Company, L.P. Telepresence system with simultaneous automatic preservation of user height, perspective, and vertical gaze
US7119816B2 (en) * 2003-03-31 2006-10-10 Microsoft Corp. System and method for whiteboard scanning to obtain a high resolution image
US7411575B2 (en) 2003-09-16 2008-08-12 Smart Technologies Ulc Gesture recognition method and touch system incorporating the same
US7274356B2 (en) 2003-10-09 2007-09-25 Smart Technologies Inc. Apparatus for determining the location of a pointer within a region of interest
US7689712B2 (en) * 2003-11-26 2010-03-30 Ricoh Company, Ltd. Techniques for integrating note-taking and multimedia information
US7355593B2 (en) * 2004-01-02 2008-04-08 Smart Technologies, Inc. Pointer tracking across multiple overlapping coordinate input sub-regions defining a generally contiguous input region
WO2005072239A2 (en) * 2004-01-21 2005-08-11 The Trustees Of Columbia University In The City Of New York Methods and systems for analyzing and summarizing video
US7657060B2 (en) * 2004-03-31 2010-02-02 Microsoft Corporation Stylization of video
US7659915B2 (en) * 2004-04-02 2010-02-09 K-Nfb Reading Technology, Inc. Portable reading device with mode processing
WO2005096760A2 (en) * 2004-04-02 2005-10-20 Kurzweil Technologies, Inc. Portable reading device with mode processing
US7460110B2 (en) 2004-04-29 2008-12-02 Smart Technologies Ulc Dual mode touch system
US7538759B2 (en) 2004-05-07 2009-05-26 Next Holdings Limited Touch panel display system with illumination and detection provided from a single edge
US8120596B2 (en) 2004-05-21 2012-02-21 Smart Technologies Ulc Tiled touch system
US7634793B2 (en) * 2004-06-03 2009-12-15 Hillcrest Laboratories, Inc. Client-server architectures and methods for zoomable user interfaces
MXPA06013950A (es) * 2004-06-04 2007-03-15 Polyvision Corp Sistemas interactivos de comunicacion.
JP5074660B2 (ja) * 2004-08-30 2012-11-14 キヤノン株式会社 情報共有システム、情報共有方法及び制御プログラム
US7873622B1 (en) 2004-09-02 2011-01-18 A9.Com, Inc. Multi-column search results interface
US8341143B1 (en) 2004-09-02 2012-12-25 A9.Com, Inc. Multi-category searching
US20060059225A1 (en) * 2004-09-14 2006-03-16 A9.Com, Inc. Methods and apparatus for automatic generation of recommended links
JP2006127367A (ja) * 2004-11-01 2006-05-18 Sony Corp 情報管理方法、情報管理プログラムおよび情報管理装置
US7639260B2 (en) * 2004-12-15 2009-12-29 Xerox Corporation Camera-based system for calibrating color displays
US7639401B2 (en) * 2004-12-15 2009-12-29 Xerox Corporation Camera-based method for calibrating color displays
US8805929B2 (en) 2005-06-20 2014-08-12 Ricoh Company, Ltd. Event-driven annotation techniques
US7554576B2 (en) * 2005-06-20 2009-06-30 Ricoh Company, Ltd. Information capture and recording system for controlling capture devices
US7694214B2 (en) * 2005-06-29 2010-04-06 Microsoft Corporation Multimodal note taking, annotation, and gaming
JP5558000B2 (ja) * 2005-07-11 2014-07-23 コーニンクレッカ フィリップス エヌ ヴェ コマンド領域において制御点位置を制御する方法及び装置の制御に関する方法
JP2007060028A (ja) * 2005-08-22 2007-03-08 Canon Inc 映像処理装置及びオブジェクト処理方法
US20070078708A1 (en) * 2005-09-30 2007-04-05 Hua Yu Using speech recognition to determine advertisements relevant to audio content and/or audio content relevant to advertisements
US8509563B2 (en) 2006-02-02 2013-08-13 Microsoft Corporation Generation of documents from images
US7536201B2 (en) * 2006-03-29 2009-05-19 Sony Ericsson Mobile Communications Ab Motion sensor character generation for mobile device
KR101327581B1 (ko) 2006-05-24 2013-11-12 엘지전자 주식회사 터치스크린 장치 및 이의 작동방법
KR101269375B1 (ko) 2006-05-24 2013-05-29 엘지전자 주식회사 터치스크린 장치 및 이의 이미지 표시방법
KR20070113018A (ko) 2006-05-24 2007-11-28 엘지전자 주식회사 터치스크린 장치 및 그 실행방법
KR20070113025A (ko) * 2006-05-24 2007-11-28 엘지전자 주식회사 터치스크린 장치 및 이의 작동방법
KR20070113022A (ko) * 2006-05-24 2007-11-28 엘지전자 주식회사 사용자 입력에 반응하는 터치스크린 장치 및 이의 작동방법
US20090213086A1 (en) * 2006-04-19 2009-08-27 Ji Suk Chae Touch screen device and operating method thereof
TW200805131A (en) * 2006-05-24 2008-01-16 Lg Electronics Inc Touch screen device and method of selecting files thereon
WO2007141204A1 (en) * 2006-06-02 2007-12-13 Anoto Ab System and method for recalling media
JP2008003968A (ja) * 2006-06-23 2008-01-10 Fuji Xerox Co Ltd 情報処理システム、情報処理方法及びプログラム
KR100856407B1 (ko) 2006-07-06 2008-09-04 삼성전자주식회사 메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법
US7925978B1 (en) 2006-07-20 2011-04-12 Adobe Systems Incorporated Capturing frames from an external source
US8245157B2 (en) * 2006-08-23 2012-08-14 Kelly Alan D Decision making and planning system, method, and software utilizing a taxonomic table of irreducible strategies or plays
US9442607B2 (en) 2006-12-04 2016-09-13 Smart Technologies Inc. Interactive input system and method
US9530142B2 (en) * 2007-02-13 2016-12-27 Claudia Juliana Minsky Method and system for creating a multifunctional collage useable for client/server communication
JP4469867B2 (ja) * 2007-03-27 2010-06-02 株式会社東芝 コミュニケーションの状況を管理する装置、方法およびプログラム
EP2135155B1 (en) 2007-04-11 2013-09-18 Next Holdings, Inc. Touch screen system with hover and click input methods
US20080255840A1 (en) * 2007-04-16 2008-10-16 Microsoft Corporation Video Nametags
US8194081B2 (en) * 2007-05-29 2012-06-05 Livescribe, Inc. Animation of audio ink
JP5149552B2 (ja) * 2007-06-22 2013-02-20 キヤノン株式会社 表示制御装置および表示制御方法
US8526632B2 (en) * 2007-06-28 2013-09-03 Microsoft Corporation Microphone array for a camera speakerphone
US8165416B2 (en) * 2007-06-29 2012-04-24 Microsoft Corporation Automatic gain and exposure control using region of interest detection
US8330787B2 (en) 2007-06-29 2012-12-11 Microsoft Corporation Capture device movement compensation for speaker indexing
US8094137B2 (en) 2007-07-23 2012-01-10 Smart Technologies Ulc System and method of detecting contact on a display
US8237850B2 (en) * 2007-08-27 2012-08-07 Sanyo Electric Co., Ltd. Electronic camera that adjusts the distance from an optical lens to an imaging surface
KR20100075460A (ko) 2007-08-30 2010-07-02 넥스트 홀딩스 인코포레이티드 저 프로파일 터치 패널 시스템
CN101802760B (zh) 2007-08-30 2013-03-20 奈克斯特控股有限公司 具有改进照明的光学触摸屏
US8405636B2 (en) 2008-01-07 2013-03-26 Next Holdings Limited Optical position sensing system and optical position sensor assembly
US8326029B1 (en) * 2008-03-21 2012-12-04 Hewlett-Packard Development Company, L.P. Background color driven content retrieval
US9300912B2 (en) * 2008-03-28 2016-03-29 Microsoft Technology Licensing, Llc Software based whiteboard capture solution for conference room meetings
US8446297B2 (en) * 2008-04-03 2013-05-21 Livescribe, Inc. Grouping variable media inputs to reflect a user session
US8446298B2 (en) * 2008-04-03 2013-05-21 Livescribe, Inc. Quick record function in a smart pen computing system
US8902193B2 (en) 2008-05-09 2014-12-02 Smart Technologies Ulc Interactive input system and bezel therefor
US20090309853A1 (en) * 2008-06-13 2009-12-17 Polyvision Corporation Electronic whiteboard system and assembly with optical detection elements
US20110110649A1 (en) * 2008-06-19 2011-05-12 Thomson Licensing Adaptive video key frame selection
US8108777B2 (en) 2008-08-11 2012-01-31 Microsoft Corporation Sections of a presentation having user-definable properties
US8639032B1 (en) 2008-08-29 2014-01-28 Freedom Scientific, Inc. Whiteboard archiving and presentation method
US8339378B2 (en) 2008-11-05 2012-12-25 Smart Technologies Ulc Interactive input system with multi-angle reflector
JP5493709B2 (ja) * 2009-03-13 2014-05-14 株式会社リコー 映像編集装置
US8380866B2 (en) 2009-03-20 2013-02-19 Ricoh Company, Ltd. Techniques for facilitating annotations
TWI384427B (zh) * 2009-04-29 2013-02-01 Utechzone Co Ltd Background establishment method and device
EP2430782A4 (en) * 2009-05-13 2012-08-08 Einstruction Corp INTERACTIVE STUDENT RESPONSE AND SYSTEM FOR COMMON CONTENT USE
US10127524B2 (en) 2009-05-26 2018-11-13 Microsoft Technology Licensing, Llc Shared collaboration canvas
US8692768B2 (en) 2009-07-10 2014-04-08 Smart Technologies Ulc Interactive input system
US8358834B2 (en) * 2009-08-18 2013-01-22 Behavioral Recognition Systems Background model for complex and dynamic scenes
US20110113486A1 (en) * 2009-11-10 2011-05-12 James Anthony Hunt Credentialing User Interface for Gadget Application Access
US20110145725A1 (en) * 2009-12-11 2011-06-16 Richard John Campbell Methods and Systems for Attaching Semantics to a Collaborative Writing Surface
TWI408610B (zh) * 2009-12-30 2013-09-11 Ind Tech Res Inst 姿勢辨識方法與系統,及其電腦程式產品
US9749709B2 (en) * 2010-03-23 2017-08-29 Apple Inc. Audio preview of music
JP2011254442A (ja) * 2010-05-06 2011-12-15 Ricoh Co Ltd 遠隔通信端末、遠隔通信方法、及び遠隔通信用プログラム
US9171578B2 (en) * 2010-08-06 2015-10-27 Futurewei Technologies, Inc. Video skimming methods and systems
US8773464B2 (en) 2010-09-15 2014-07-08 Sharp Laboratories Of America, Inc. Methods and systems for collaborative-writing-surface image formation
CN102446345B (zh) * 2010-09-30 2015-09-30 株式会社理光 一种对于白板彩色图像进行颜色增强的方法、装置及系统
US9118612B2 (en) 2010-12-15 2015-08-25 Microsoft Technology Licensing, Llc Meeting-specific state indicators
US9383888B2 (en) 2010-12-15 2016-07-05 Microsoft Technology Licensing, Llc Optimized joint document review
US9864612B2 (en) 2010-12-23 2018-01-09 Microsoft Technology Licensing, Llc Techniques to customize a user interface for different displays
EP2490424B1 (en) * 2011-02-18 2020-04-08 BlackBerry Limited Method and system for recording a conference call
DE112011104981T5 (de) 2011-03-31 2014-02-06 Hewlett-Packard Development Co., L.P. Ergänzung von Elementen der Benutzeroberfläche
EP2735141A4 (en) * 2011-07-18 2015-03-04 Viggle Inc SYSTEM AND METHOD FOR PURSUIT AND REWARDING MEDIA AND ENTERTAINMENT USE WITH PRACTICALLY REAL-TIME REWARDS
CN103891303B (zh) 2011-08-16 2018-03-09 黛斯悌尼软件产品有限公司 基于脚本的视频呈现
US8682973B2 (en) 2011-10-05 2014-03-25 Microsoft Corporation Multi-user and multi-device collaboration
US9544158B2 (en) 2011-10-05 2017-01-10 Microsoft Technology Licensing, Llc Workspace collaboration via a wall-type computing device
US9996241B2 (en) 2011-10-11 2018-06-12 Microsoft Technology Licensing, Llc Interactive visualization of multiple software functionality content items
US10198485B2 (en) 2011-10-13 2019-02-05 Microsoft Technology Licensing, Llc Authoring of data visualizations and maps
CN102521829A (zh) * 2011-11-22 2012-06-27 无锡海森诺科技有限公司 一种光学触控图像校定方法
US20130198653A1 (en) * 2012-01-11 2013-08-01 Smart Technologies Ulc Method of displaying input during a collaboration session and interactive board employing same
NO341403B1 (no) * 2012-02-27 2017-10-30 Ablecon As Hjelpemiddelsystem for synshemmede
US8917934B2 (en) * 2012-06-14 2014-12-23 International Business Machines Corporation Multi-cue object detection and analysis
US8904304B2 (en) * 2012-06-25 2014-12-02 Barnesandnoble.Com Llc Creation and exposure of embedded secondary content data relevant to a primary content page of an electronic book
CN103517020A (zh) * 2012-06-29 2014-01-15 联想(北京)有限公司 一种数据处理方法及装置、电子设备
JP6160305B2 (ja) * 2012-08-01 2017-07-12 株式会社リコー 画像処理装置、プログラム、画像処理システムおよび画像処理方法
US9195697B2 (en) * 2012-10-26 2015-11-24 Livescribe Inc. Correlation of written notes to digital content
IL223225A (en) * 2012-11-25 2013-11-28 Eliahu Antopolsky Meetings documentation system that allows access to documentation with the consent of participants only
US8805068B2 (en) * 2012-12-13 2014-08-12 Microsoft Corporation Automatic classification and color enhancement of a markable surface
US9892761B2 (en) * 2013-02-22 2018-02-13 Fuji Xerox Co., Ltd. Systems and methods for creating and using navigable spatial overviews for video
US10482777B2 (en) * 2013-02-22 2019-11-19 Fuji Xerox Co., Ltd. Systems and methods for content analysis to support navigation and annotation in expository videos
US20140280186A1 (en) * 2013-03-15 2014-09-18 International Business Machines Corporation Crowdsourcing and consolidating user notes taken in a virtual meeting
US10629188B2 (en) 2013-03-15 2020-04-21 International Business Machines Corporation Automatic note taking within a virtual meeting
CN104079862A (zh) * 2013-03-30 2014-10-01 深圳市潮流网络技术有限公司 一种视频电子白板业务实现方法及装置
EP2981931B1 (en) * 2013-04-02 2021-03-03 3M Innovative Properties Company Systems and methods for managing notes
US9846526B2 (en) * 2013-06-28 2017-12-19 Verizon and Redbox Digital Entertainment Services, LLC Multi-user collaboration tracking methods and systems
JP2015022393A (ja) * 2013-07-17 2015-02-02 株式会社リコー 電子機器、画像データ表示処理方法、及びプログラム
US9646386B2 (en) * 2013-08-16 2017-05-09 Thomson Licensing Method and apparatus for generating temporally consistent superpixels
JP2015069284A (ja) * 2013-09-27 2015-04-13 株式会社リコー 画像処理装置
KR102058267B1 (ko) * 2013-11-14 2019-12-20 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 생산성 애플리케이션의 이미지 처리 기법
JP6244846B2 (ja) * 2013-11-18 2017-12-13 株式会社リコー 情報処理端末、情報処理方法、プログラム、及び情報処理システム
JP2015171039A (ja) * 2014-03-07 2015-09-28 キヤノン株式会社 色処理装置およびその方法
US20150268825A1 (en) * 2014-03-18 2015-09-24 Here Global B.V. Rendering of a media item
US9471957B2 (en) 2014-03-28 2016-10-18 Smart Technologies Ulc Method for partitioning, managing and displaying a collaboration space and interactive input system employing same
GB201406070D0 (en) * 2014-04-04 2014-05-21 Eads Uk Ltd Method of capturing and structuring information from a meeting
US9706168B1 (en) * 2014-10-13 2017-07-11 Surround.IO Room conferencing system with heat map annotation of documents
KR102337157B1 (ko) * 2014-11-05 2021-12-08 삼성전자주식회사 전자 칠판 장치 및 그 제어 방법
US10839494B2 (en) * 2015-02-13 2020-11-17 Light Blue Optics Ltd Timeline image capture systems and methods
US10540755B2 (en) 2015-02-13 2020-01-21 Light Blue Optics Ltd. Image processing systems and methods
US9530102B2 (en) * 2015-02-17 2016-12-27 The Mathworks, Inc. Multimodal input processing
US9910840B2 (en) 2015-04-03 2018-03-06 Microsoft Technology Licensing, Llc Annotating notes from passive recording with categories
JP6428509B2 (ja) * 2015-06-30 2018-11-28 京セラドキュメントソリューションズ株式会社 情報処理装置、及び画像形成装置
US9736139B2 (en) 2015-08-13 2017-08-15 Microsoft Technology Licensing, Llc Storage of captured sensitive data with bypass of local storage
CN105306861B (zh) * 2015-10-15 2017-03-01 深圳市鹰硕技术有限公司 一种网络教学录播方法及系统
US10417021B2 (en) 2016-03-04 2019-09-17 Ricoh Company, Ltd. Interactive command assistant for an interactive whiteboard appliance
US10409550B2 (en) * 2016-03-04 2019-09-10 Ricoh Company, Ltd. Voice control of interactive whiteboard appliances
US20170300752A1 (en) * 2016-04-18 2017-10-19 Yen4Ken, Inc. Method and system for summarizing multimedia content
JP2017215833A (ja) * 2016-06-01 2017-12-07 株式会社リコー 情報処理システム、情報処理方法、情報処理装置およびプログラム
US10296533B2 (en) * 2016-07-07 2019-05-21 Yen4Ken, Inc. Method and system for generation of a table of content by processing multimedia content
US9940698B1 (en) * 2016-09-30 2018-04-10 Konica Minolta Laboratory U.S.A., Inc. Cleaning writing boards based on strokes
CN106570919A (zh) * 2016-10-13 2017-04-19 深圳市创易联合科技有限公司 电子笔迹的保存方法和还原方法
US20180160200A1 (en) * 2016-12-03 2018-06-07 Streamingo Solutions Private Limited Methods and systems for identifying, incorporating, streamlining viewer intent when consuming media
US20180232192A1 (en) * 2017-02-14 2018-08-16 Samson Timoner System and Method for Visual Enhancement, Annotation and Broadcast of Physical Writing Surfaces
US10642478B2 (en) 2017-04-10 2020-05-05 Microsoft Technology Licensing Llc Editable whiteboard timeline
US10650813B2 (en) * 2017-05-25 2020-05-12 International Business Machines Corporation Analysis of content written on a board
CN108986036B (zh) * 2017-06-01 2022-01-28 中兴通讯股份有限公司 处理文件的方法、终端
US10284815B2 (en) * 2017-07-26 2019-05-07 Blue Jeans Network, Inc. System and methods for physical whiteboard collaboration in a video conference
CN107481227B (zh) * 2017-07-27 2020-07-10 广州视源电子科技股份有限公司 教学板书图像处理方法、装置、智能教学设备及存储介质
US10810265B2 (en) * 2017-10-31 2020-10-20 Jpmorgan Chase Bank, N.A. Automatic note board data capture and export
US20190149348A1 (en) * 2017-11-15 2019-05-16 Eliahu Antopolsky Recording System with Personal Keys for Personal Meetings with Service Providers
GB201719080D0 (en) * 2017-11-17 2018-01-03 Light Blue Optics Ltd Device authorization systems
WO2019110986A1 (en) * 2017-12-04 2019-06-13 Light Blue Optics Ltd Timeline image capture systems and methods
US11321880B2 (en) * 2017-12-22 2022-05-03 Sony Corporation Information processor, information processing method, and program for specifying an important region of an operation target in a moving image
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method
JP2020098420A (ja) * 2018-12-17 2020-06-25 ソニー株式会社 画像処理装置、画像処理方法及びプログラム
EP3912338B1 (en) 2019-01-14 2024-04-10 Dolby Laboratories Licensing Corporation Sharing physical writing surfaces in videoconferencing
CN109885224A (zh) * 2019-02-26 2019-06-14 努比亚技术有限公司 输入法界面显示方法、存储介质和移动终端
CN110446002A (zh) * 2019-07-30 2019-11-12 视联动力信息技术股份有限公司 一种视频会议的处理方法、系统及装置和存储介质
CN111262874A (zh) * 2020-01-21 2020-06-09 北京梦想加信息技术有限公司 书写板信息分享方法、系统和书写板
US11928226B2 (en) 2021-02-04 2024-03-12 International Business Machines Corporation Content protecting collaboration board
US11704009B2 (en) * 2021-10-15 2023-07-18 Google Llc Video conference virtual whiteboard
US20240039971A1 (en) * 2022-07-29 2024-02-01 Zoom Video Communications, Inc. Sharing virtual whiteboard content

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09510852A (ja) * 1994-09-02 1997-10-28 ベル コミュニケーションズ リサーチ,インコーポレイテッド マルチメディア・イベントを記録再生するシステムおよび方法
JPH10214270A (ja) * 1997-01-29 1998-08-11 Fuji Xerox Co Ltd 情報蓄積装置および情報蓄積再生装置
WO2000027125A1 (en) * 1998-11-03 2000-05-11 Telcordia Technologies, Inc. A method and apparatus for an automatic camera selection system

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2892901B2 (ja) * 1992-04-27 1999-05-17 インターナショナル・ビジネス・マシーンズ・コーポレイション プレゼンテーションの獲得、管理およびプレイバック用自動化システム及び方法
WO1994027234A1 (en) * 1993-05-10 1994-11-24 Taligent, Inc. Multimedia synchronization system
US5796426A (en) 1994-05-27 1998-08-18 Warp, Ltd. Wide-angle image dewarping method and apparatus
US5990934A (en) 1995-04-28 1999-11-23 Lucent Technologies, Inc. Method and system for panoramic viewing
US5745305A (en) 1995-04-28 1998-04-28 Lucent Technologies Inc. Panoramic viewing apparatus
US5539483A (en) 1995-06-30 1996-07-23 At&T Corp. Panoramic projection apparatus
US5793527A (en) 1995-06-30 1998-08-11 Lucent Technologies Inc. High resolution viewing system
US20020002562A1 (en) * 1995-11-03 2002-01-03 Thomas P. Moran Computer controlled display system using a graphical replay device to control playback of temporal data representing collaborative activities
US6115176A (en) 1995-11-30 2000-09-05 Lucent Technologies Inc. Spherical viewing/projection apparatus
US6111702A (en) 1995-11-30 2000-08-29 Lucent Technologies Inc. Panoramic viewing system with offset virtual optical centers
US6373642B1 (en) 1996-06-24 2002-04-16 Be Here Corporation Panoramic imaging arrangement
US6331869B1 (en) 1998-08-07 2001-12-18 Be Here Corporation Method and apparatus for electronically distributing motion panoramic images
US6493032B1 (en) 1996-06-24 2002-12-10 Be Here Corporation Imaging arrangement which allows for capturing an image of a view at different resolutions
US6459451B2 (en) 1996-06-24 2002-10-01 Be Here Corporation Method and apparatus for a panoramic camera to capture a 360 degree image
US6341044B1 (en) 1996-06-24 2002-01-22 Be Here Corporation Panoramic imaging arrangement
KR100191329B1 (ko) * 1996-10-23 1999-06-15 윤종용 인터넷상에서의 원격교육방법 및 그 장치.
US6806903B1 (en) * 1997-01-27 2004-10-19 Minolta Co., Ltd. Image capturing apparatus having a γ-characteristic corrector and/or image geometric distortion correction
US6148304A (en) * 1997-03-19 2000-11-14 Microsoft Corporation Navigating multimedia content using a graphical user interface with multiple display regions
US6043837A (en) 1997-05-08 2000-03-28 Be Here Corporation Method and apparatus for electronically distributing images from a panoptic camera system
US6356296B1 (en) 1997-05-08 2002-03-12 Behere Corporation Method and apparatus for implementing a panoptic camera system
US6466254B1 (en) 1997-05-08 2002-10-15 Be Here Corporation Method and apparatus for electronically distributing motion panoramic images
US6388654B1 (en) * 1997-10-03 2002-05-14 Tegrity, Inc. Method and apparatus for processing, displaying and communicating images
US5986655A (en) * 1997-10-28 1999-11-16 Xerox Corporation Method and system for indexing and controlling the playback of multimedia documents
US7263659B2 (en) * 1998-09-09 2007-08-28 Ricoh Company, Ltd. Paper-based interface for multimedia information
US6924832B1 (en) 1998-08-07 2005-08-02 Be Here Corporation Method, apparatus & computer program product for tracking objects in a warped video image
US6141145A (en) 1998-08-28 2000-10-31 Lucent Technologies Stereo panoramic viewing system
US6128143A (en) 1998-08-28 2000-10-03 Lucent Technologies Inc. Panoramic viewing system with support stand
US6195204B1 (en) 1998-08-28 2001-02-27 Lucent Technologies Inc. Compact high resolution panoramic viewing system
US6285365B1 (en) 1998-08-28 2001-09-04 Fullview, Inc. Icon referenced panoramic image display
US6144501A (en) 1998-08-28 2000-11-07 Lucent Technologies Inc. Split mirrored panoramic image display
US6369818B1 (en) 1998-11-25 2002-04-09 Be Here Corporation Method, apparatus and computer program product for generating perspective corrected data from warped information
US6175454B1 (en) 1999-01-13 2001-01-16 Behere Corporation Panoramic imaging arrangement
US6597520B2 (en) 1999-01-13 2003-07-22 Be Here Corporation Panoramic imaging arrangement
US6529920B1 (en) * 1999-03-05 2003-03-04 Audiovelocity, Inc. Multimedia linking device and method
US6871782B2 (en) * 1999-10-08 2005-03-29 Canon Kabushiki Kaisha User programmable smart card interface system having an arbitrary mapping
EP1256051A4 (en) * 2000-01-25 2004-09-29 Autodesk Inc DEVICE AND METHOD FOR ACCESSING ARCHITECTURAL DRAWINGS BY MEANS OF THE INTERNET AND FOR PROCESSING THESE DRAWINGS
US20010035976A1 (en) * 2000-02-15 2001-11-01 Andrew Poon Method and system for online presentations of writings and line drawings
WO2001061633A2 (en) * 2000-02-15 2001-08-23 Siemens Technology-To-Business Center, Llc Electronic whiteboard system using a tactile foam sensor
US6671732B1 (en) * 2000-07-24 2003-12-30 Comverse Ltd. Method and apparatus for control of content based rich media streaming
KR20020012699A (ko) * 2000-08-08 2002-02-20 구자홍 놀이시설/교육시설의 모니터링 시스템과 이를 이용한모니터링 서비스 제공방법
US6741250B1 (en) 2001-02-09 2004-05-25 Be Here Corporation Method and system for generation of multiple viewpoints into a scene viewed by motionless cameras and for presentation of a view path
US6756990B2 (en) 2001-04-03 2004-06-29 Be Here Corporation Image filtering on 3D objects using 2D manifolds
US6937266B2 (en) * 2001-06-14 2005-08-30 Microsoft Corporation Automated online broadcasting system and method using an omni-directional camera system for viewing meetings over a computer network
US20040021764A1 (en) 2002-01-28 2004-02-05 Be Here Corporation Visual teleconferencing apparatus
US20040008423A1 (en) 2002-01-28 2004-01-15 Driscoll Edward C. Visual teleconferencing apparatus
US20030142402A1 (en) 2002-01-30 2003-07-31 Be Here Corporation Method and apparatus for triggering a remote flash on a camera with a panoramic lens
US7012757B2 (en) 2002-05-08 2006-03-14 Be Here Corporation Method for designing a lens system and resulting apparatus
US7019918B2 (en) 2003-06-12 2006-03-28 Be Here Corporation Panoramic imaging system
US20040254982A1 (en) 2003-06-12 2004-12-16 Hoffman Robert G. Receiving system for video conferencing system
US7428000B2 (en) * 2003-06-26 2008-09-23 Microsoft Corp. System and method for distributed meetings
US7260278B2 (en) * 2003-11-18 2007-08-21 Microsoft Corp. System and method for real-time whiteboard capture and processing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09510852A (ja) * 1994-09-02 1997-10-28 ベル コミュニケーションズ リサーチ,インコーポレイテッド マルチメディア・イベントを記録再生するシステムおよび方法
JPH10214270A (ja) * 1997-01-29 1998-08-11 Fuji Xerox Co Ltd 情報蓄積装置および情報蓄積再生装置
WO2000027125A1 (en) * 1998-11-03 2000-05-11 Telcordia Technologies, Inc. A method and apparatus for an automatic camera selection system
JP2002529975A (ja) * 1998-11-03 2002-09-10 テルコーディア テクノロジーズ インコーポレイテッド 自動カメラ選択システムのための方法および装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006178749A (ja) * 2004-12-22 2006-07-06 Fuji Xerox Co Ltd 情報処理装置、ネットワークシステム、方法、プログラム
US7898566B2 (en) 2005-08-22 2011-03-01 Canon Kabushiki Kaisha Video processing apparatus and object identifying method
US7991829B2 (en) 2006-05-31 2011-08-02 Fuji Xerox Co., Ltd. Electronic device, network connecting system, network connecting method, and program product therefor
US8731299B2 (en) 2008-06-14 2014-05-20 Microsoft Corporation Techniques to manage a whiteboard for multimedia conference events
JP2011524572A (ja) * 2008-06-14 2011-09-01 マイクロソフト コーポレーション マルチメディア会議イベント用のホワイトボード管理手法
JP2012129990A (ja) * 2010-11-25 2012-07-05 Ricoh Co Ltd 画像処理装置、及び画像処理プログラム
JP2012134959A (ja) * 2010-11-29 2012-07-12 Ricoh Co Ltd 画像処理装置、及び画像処理プログラム
JP2012119972A (ja) * 2010-12-01 2012-06-21 Ricoh Co Ltd 画像処理装置、及び画像処理プログラム
JP2012199911A (ja) * 2011-03-10 2012-10-18 Ricoh Co Ltd 情報処理装置
JP2013162341A (ja) * 2012-02-06 2013-08-19 Nippon Telegr & Teleph Corp <Ntt> チャプタ代表画像生成装置およびその動作方法
JP2015109612A (ja) * 2013-12-05 2015-06-11 キヤノン株式会社 画像音声再生システム及び画像音声再生方法とプログラム
CN110809769A (zh) * 2017-06-26 2020-02-18 哈德利公司 智能白板协作系统和方法
JP2020525962A (ja) * 2017-06-26 2020-08-27 ハドリー インコーポレイテッド インテリジェントホワイトボード連携システムおよび方法
JP7230016B2 (ja) 2017-06-26 2023-02-28 ハドリー インコーポレイテッド インテリジェントホワイトボード連携システムおよび方法
CN110809769B (zh) * 2017-06-26 2024-02-13 哈德利公司 智能白板协作系统和方法
WO2019065345A1 (ja) * 2017-09-28 2019-04-04 日本電気株式会社 録音再生システム、録音再生方法、録音装置、記録媒体および録画装置
JPWO2019065345A1 (ja) * 2017-09-28 2020-11-19 日本電気株式会社 録音装置、録音制御プログラムおよび録画装置
JP7095703B2 (ja) 2017-09-28 2022-07-05 日本電気株式会社 録音装置、録音制御プログラムおよび録画装置
US11403834B2 (en) 2017-09-28 2022-08-02 Nec Corporation Sound recording device, recording medium, and image recording device

Also Published As

Publication number Publication date
US20070126755A1 (en) 2007-06-07
US20030234772A1 (en) 2003-12-25
TW200405260A (en) 2004-04-01
KR100996787B1 (ko) 2010-11-25
US7770116B2 (en) 2010-08-03
CN1477590A (zh) 2004-02-25
US7260257B2 (en) 2007-08-21
JP4499380B2 (ja) 2010-07-07
KR20030097669A (ko) 2003-12-31
EP1388794A2 (en) 2004-02-11
CN1477590B (zh) 2010-05-26
US20070269105A1 (en) 2007-11-22
EP1388794A3 (en) 2012-02-22

Similar Documents

Publication Publication Date Title
JP4499380B2 (ja) ホワイトボードおよび音声のキャプチャのためのシステムおよび方法
US11849196B2 (en) Automatic data extraction and conversion of video/images/sound information from a slide presentation into an editable notetaking resource with optional overlay of the presenter
US20210056251A1 (en) Automatic Data Extraction and Conversion of Video/Images/Sound Information from a Board-Presented Lecture into an Editable Notetaking Resource
CN1680939B (zh) 数字文件和数据的快速可视分类方法
US7260278B2 (en) System and method for real-time whiteboard capture and processing
JP4833573B2 (ja) 複合的な電子表現物を作成する方法、装置及びデータ処理システム
Erol et al. Linking multimedia presentations with their symbolic source documents: algorithm and applications
US9218367B2 (en) Method and interface for indexing related media from multiple sources
JP5510167B2 (ja) ビデオ検索システムおよびそのためのコンピュータプログラム
US20140164927A1 (en) Talk Tags
US8375312B2 (en) Classifying digital media based on content
JP2002057981A (ja) データストリームにアクセスするインタフェース、データストリームへのアクセス用検索の形成方法、データストリームアクセス方法及びノートからビデオにアクセスするためのデバイス
JP2005527996A (ja) プレゼンテーションを記録するためのシステム
He et al. Why take notes? Use the whiteboard capture system
He et al. Real-time whiteboard capture and processing using a video camera for remote collaboration
Behera et al. Looking at projected documents: Event detection & document identification
Behera et al. DocMIR: An automatic document-based indexing system for meeting retrieval
Ram et al. Video Analysis and Repackaging for Distance Education
Friedland et al. Anthropocentric video segmentation for lecture webcasts
Wallick et al. Marker and chalkboard regions
Li Multimedia Signal Processing, Sep. 1999, pp. 587-592, Copenhagen
JP2009026261A (ja) マルチマディア情報処理システム、マルチメディア情報処理システム用プログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060615

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100105

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100409

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100415

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4499380

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140423

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees