JP2008005359A - ドキュメントカメラ装置 - Google Patents

ドキュメントカメラ装置 Download PDF

Info

Publication number
JP2008005359A
JP2008005359A JP2006174631A JP2006174631A JP2008005359A JP 2008005359 A JP2008005359 A JP 2008005359A JP 2006174631 A JP2006174631 A JP 2006174631A JP 2006174631 A JP2006174631 A JP 2006174631A JP 2008005359 A JP2008005359 A JP 2008005359A
Authority
JP
Japan
Prior art keywords
image
image data
data
unit
document camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006174631A
Other languages
English (en)
Other versions
JP4876736B2 (ja
Inventor
Kengo Omura
賢悟 大村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006174631A priority Critical patent/JP4876736B2/ja
Publication of JP2008005359A publication Critical patent/JP2008005359A/ja
Application granted granted Critical
Publication of JP4876736B2 publication Critical patent/JP4876736B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)

Abstract

【課題】 会議の様子を忠実に再現し、会議の内容理解が容易となるドキュメントカメラ装置を提供する。
【解決手段】 スクリーンに投影される投影用の画像データを撮影するドキュメントカメラ1であって、投影される画像データの切り替えタイミングを検出する画像取得部31と、発言者の音声を音声データとして取り込むマイク9と、画像取得部31の検出した切り替えタイミングに応じて音声データを分割する音声取得部32と、投影用の画像データと、この画像データの投影中に入力した音声データとを関連付けて、記憶手段に格納する関連付け処理部33とを有している。
【選択図】 図2

Description

本発明は、原稿や書類等のドキュメントを撮影するカメラを備え、このカメラによって撮影された画像を表示装置に表示するドキュメントカメラ装置に関する。
紙に印刷された文書、図面、写真などのドキュメント、さらには立体物などを撮影し、撮影した画像をスクリーンやディスプレイに表示させるカメラ装置をドキュメントカメラ(書画カメラ)という。
ドキュメントカメラ装置は、一般的にドキュメントを撮影するためのカメラと、カメラを支え、被写体を好適な角度から撮影できるように上下左右に可動可能なスタンドと、撮影して得られた画像データをプロジェクタやディスプレイに送るためのインターフェースとを備えている。例えば、会議の前までに資料を事前にPC等に読み込んでおかなくても、ドキュメントカメラ装置で撮影して取り込むことで、その場で画像をスクリーンに投影することができる。
また、一度カメラで撮影して取り込んだ画像をコンピュータに保存する機能を搭載したドキュメントカメラ装置も提案されている(例えば、特許文献1参照)。
特開2005−79727号公報
しかしながら、画像が表示されている間になされた発話者の発言等の音声データを画像に関連付けて保存することができなかったため、画像データを保存できる機能を持ったドキュメントカメラであっても、表示された画像データに対応する説明音声を再生して聞くことができないという問題がある。
また、撮影された画像データを保存できるドキュメントカメラであっても、画像の変化を検出して、必要な画像データだけを保存しなければ、記憶装置の容量を無駄に消費するという課題を有している。
本発明は上記事情に鑑みてなされたものであり、会議の様子を忠実に再現し、会議の内容理解が容易となるドキュメントカメラ装置を提供することを目的とする。
かかる目的を達成するために本発明のドキュメントカメラ装置は、スクリーンに投影される投影用の画像データを撮影するドキュメントカメラ装置であって、投影される画像データの切り替えタイミングを検出する検出手段と、発言者の音声を音声データとして取り込む音声入力手段と、前記検出手段の検出した切り替えタイミングに応じて前記音声データを分割する分割手段と、前記投影用の画像データと、該画像データの投影中に入力した音声データとを関連付けて、記憶手段に格納する関連付け手段とを有する構成としている。
このように本発明は、撮影した画像データと、この画像データに対する発言とが関連付けされて記憶手段に格納されるので、画像データを表示しながら音声データを再生することができる。従って、会議の様子を忠実に再現することができ、会議の内容理解が容易となる。
上記ドキュメントカメラ装置において、前記検出手段は、撮影された画像データを順次入力し、直前の画像データと比較して画像に変化のある画像を検出して、前記切り替えタイミングを検出するとよい。
従って、画像に変化のある画像データだけを取り込んで記憶手段に格納しておくので、不要な画像データを記憶手段に記憶することがなく、記憶手段の記憶容量を無駄に消費しない。
上記ドキュメントカメラ装置において、前記投影用の画像データを撮影する第1撮影手段を備え、前記検出手段は、前記第1撮影手段に撮影を指示する操作手段からの操作入力を検出して、前記切り替えタイミングを検出するとよい。
従って、操作手段からの入力によって画像の切り替えタイミングを検出するので、音声データと画像データの関連付けを正確に行うことができる。
上記ドキュメントカメラ装置において、前記投影用の画像データと、該画像データに関連付けられた音声データとを前記記憶手段から読み出して、再生させる再生制御手段を有するとよい。
従って、画像データと、この画像データに関連付けられた音声データとを再生し、会議の様子を再現することができる。
上記ドキュメントカメラ装置において、発言者や会議室の様子を撮影する第2撮影手段を備え、前記関連付け手段は、前記第2撮影手段で撮影された画像データと、前記投影用の画像データとを関連付けて、前記記憶手段に格納するとよい。
従って、会議で使用した資料と、その資料に対する発言とを再現すると共に、会議中の発言者や会議室の様子を利用者に認識させることができる。
上記ドキュメントカメラ装置において、前記検出手段は、画像データの画像特徴量を抽出し、該画像特徴量と前記直前の画像データの画像特徴量とを比較することで、前記画像に変化のある画像データを検出するとよい。
また、前記検出手段は、画像のカラーヒストグラムと、色分布と、濃度一様な画像パターン数と、画素数と画素配列と、画像のエッジ数との少なくとも1つを前記画像特徴量として抽出するとよい。
さらに、前記検出手段は、画像データから抽出したテキスト情報と、前記直前の画像データから抽出したテキスト情報とを比較して、前記画像に変化のある画像データを検出してもよい。
従って、画像の変化を正確に検出することができる。
上記ドキュメントカメラ装置において、前記投影用の画像データを撮影する第1撮影手段を備え、前記検出手段は、前記第1撮影手段の撮影位置に資料が配置されているか否かを検出する第2検出手段からのセンサ信号を入力して、前記切り替えタイミングを検出するとよい。
従って、画像の変化を正確に検出することができる。
上記ドキュメントカメラ装置において、撮影された画像データのサムネイル画像を作成するサムネイル作成手段を有し、前記関連付け手段は、前記サムネイル画像を、該サムネイル画像の作成元の画像データに関連付けて前記記憶手段に格納するとよい。
従って、サムネイル画像を表示して、選択されたサムネイル画像に関連付けられた画像データや音声データを再生することができる。
上記ドキュメントカメラ装置において、撮影された画像データからテキスト情報を抽出し、形態素解析を行って前記テキスト情報から分離した形態素を前記記憶手段に格納する文字認識手段と、前記音声入力手段から入力された音声データに対して、音声認識処理を行ってテキスト情報を抽出し、形態素解析を行って前記テキスト情報から分離した形態素を前記記憶手段に格納する音声認識手段とを有し、前記関連付け手段は、前記形態素を、該形態素を検出した画像データや音声データに関連付けて前記記憶手段に格納し、検索語を含む画像データ又は音声データを前記記憶手段から検索する検索手段を有するとよい。
従って、検索語を入力して所望の画像データや音声データを検出することができる。
本発明によれば、会議の様子を忠実に再現し、会議の内容理解が容易となるドキュメントカメラ装置を提供することができる。
添付図面を参照しながら本発明の好適な実施例を説明する。
まず、図1を参照しながら本実施例のドキュメントカメラ1の構成を説明する。
図1に示すように本実施例のドキュメントカメラ1は、カメラ等の第1画像入力部(第1撮影手段)2と、第1画像入力部2を支え、被写体となるドキュメントを好適な位置から撮影できるようにXYZ方向に稼動するフレキシブルアーム3と、被写体となるドキュメントを載置するスタンド4とを有している。また、ドキュメントカメラ1は、マイク端子8を備え、マイク9を接続することができる。さらに、第1画像入力部2で撮影された画像をスクリーン等に表示するプロジェクタ装置10がドキュメントカメラ1には接続可能となっている。
次に、ドキュメントカメラ1のより詳細な構成について図2を参照しながら説明する。
図2に示すようにドキュメントカメラ1は、第1画像入力部2と、画像処理部21と、記録開始・終了操作部22と、音声入力部9と、再生制御情報入力部23と、登録データ表示部24と、撮影指示操作部25とを有している。
第1画像入力部2は、例えばCCD等の撮像素子と、この撮像素子にスタンド4上の資料の像を結像するレンズ機構とを有している。レンズ機構は、複数のレンズからなる撮像倍率が可変なズームレンズ機構を備えている。撮像素子によって撮像された画像データは、画像処理部21に送出される。
画像処理部21は、第1画像入力部2で撮像された画像データ(アナログデータ)をデジタルデータに形式変換する。また画像処理部21は、必要に応じて歪み補正、傾き補正等の画像処理を施し、処理された画像データをドキュメントカメラ1に接続されたプロジェクタ装置10に転送する。プロジェクタ装置10は、ドキュメントカメラ1から供給された画像データをスクリーン(不図示)に投影する。
撮影指示操作部(本発明の操作手段に該当する)25は、第1画像入力部2に画像の撮影を指示する操作部である。撮影指示操作部25が操作されると、後述する画像取得部31にも撮影指示操作部25から操作信号が入力される。画像取得部31は、撮影指示操作部25からの操作信号によって、画像データの撮影タイミングを認識する。
記録開始・終了操作部22は、画像・音声記録再生部30に画像と音声の取り込み開始や終了を指示するための操作部である。再生制御情報入力部23は、画像・音声記録再生部30に記録された画像や音声の再生操作を行うための操作部である。記録開始・終了操作部22と、再生制御情報入力部23と、撮影指示操作部25とは、ドキュメントカメラ本体のスタンド4上に設けられたコントロールパネル7によって構成される。
図3に、コントロールパネルの一例を示す。本実施例のコントロールパネル7には、画像データと音声データの取り込みを画像・音声記録再生部30に指示する画像・音声記録ボタン71と、第1画像入力部2に画像の撮影を指示する撮影ボタン72と、再生制御情報入力部23として機能する再生ボタン73、巻き戻し76、早送り77、一時停止75、停止74の各ボタンとが設けられている。この他にメニュー表示ボタン78、ズーム設定ボタン79などが設けられている。
音声入力部9は、発話者の音声を入力するマイクである。音声入力部9は、ドキュメントカメラ1の本体内に内蔵させてもよいし、図1のようにマイク端子8を介してドキュメントカメラ1の本体に接続してもよい。
登録データ表示部24は、画像・音声記録再生部30に記録されたデータを表示するためのものである。登録データ表示部24は、ドキュメントカメラ本体のスタンド4上に設置された液晶ディスプレイ6によって構成され、画像・音声記録再生部30に登録された画像のサムネイル画像等が表示される(図3参照)。
次に、画像・音声記録再生部30の詳細について説明する。図2に示すように画像・音声記録再生部30内には、画像取得部(本発明の検出手段、サムネイル作成手段に該当する)31と、音声取得部32と、関連付け処理部(本発明の関連付け処理手段に該当する)33と、再生制御部34と、データ格納部35と、画像・音声再生部36とが設けられている。
画像取得部31は、画像処理部21から画像データと、この画像データの撮影時間情報とを入力して、スクリーンに投影される画像データが切り替わる切り替えタイミングを検出する。この他に、撮影指示操作部25から撮影を指示する操作信号を入力して、画像取得部31が画像データの切り替えタイミングを検出することもできる。画像取得部31は、スクリーンに投影する画像データの切り替えタイミングを検知すると、音声取得部32にタイミング信号を出力し、画像の取得を通知する。
また、画像取得部31は、取得した画像データのサムネイル画像を生成する。画像取得部31は、生成したサムネイル画像と、画像データとに識別子を付与して、データ格納部35に格納する。画像データは、圧縮してデータ格納部35に格納される。画像取得部31は、データ格納部35にデータを格納すると、生成した識別子(サムネイル画像と画像データに付与した識別子)と、データ格納部35のアドレスと、画像処理部21から取得した画像データの撮影時間情報とを関連付け処理部33に出力する。
音声取得部32は、音声入力部9から音声データを入力し、画像データの切り替えタイミングを示すタイミング信号に従って、音声データを分割する。分割した音声データには識別子(音声データ識別子と呼ぶ)を付与して、データ格納部35に格納する。さらに音声取得部32は、音声データを格納したデータ格納部35のアドレスを関連付け処理部33に出力する。
関連付け処理部33は、データ格納部35に格納された画像データ、サムネイル画像、音声データの関連付けを行うために索引ファイルを生成する。なお、以下では、関連付けされる画像データと、サムネイル画像と、音声データとをデータセットと呼ぶ。索引ファイルは、図4に示すようにデータセットごとに付与されるデータ識別子、データセットが生成された時間(年月日)、時間(時分秒)、1回のプレゼンテーションで得られたデータセットに共通に付与されるプレゼン識別子、画像データを識別する画像データ識別子、音声データを識別する音声データ識別子、サムネイル画像を識別するサムネイル識別子などを有している。その他に画像データを格納したデータ格納部35のアドレス、音声データを格納したデータ格納部35のアドレス、サムネイル画像を格納したデータ格納部35のアドレスが保存される。
関連付け処理部33は、画像データ、サムネイル画像、音声データにそれぞれ付与された識別子を索引ファイルに格納する時に、画像取得部31から取得した画像データの撮影時間情報(年月日、時分秒)も索引ファイルに格納する。
また、関連付け処理部33は、1回のプレゼンテーションで得られるデータセットを識別できるようにプレゼン識別子を付与する。プレゼンテーションの最初に得られるデータセットには、このプレゼンテーションに共通するプレゼン識別子と、プレゼンテーションの開始点であることを示すStart情報とが付与される。また、1回のプレゼンテーションで最後に得られるデータセットには、プレゼン識別子と、プレゼンテーションの終了点であることを示すEnd情報とが付与される。
再生制御部34は、画像と音声の再生を制御するもので、再生制御情報入力部23から入力された指示に従って処理を実行する。具体的には、指示された識別子(データ識別子、プレゼン識別子、画像データ識別子、音声データ識別子等)を画像・音声再生部36に通知して、画像・音声再生部36に画像や音声を再生させる。
画像・音声再生部36は、再生制御部34によって指示された画像データや音声データをデータ格納部35から読み出して展開処理し、画像データをプロジェクタ装置10に、音声データを音声出力部11に出力する。
本実施例のドキュメントカメラ1は、プレゼンテーション資料を撮影した画像データと、この画像データをプロジェクタ装置10でスクリーンに表示している時の会議での発言を記録した音声データとを関連付けて保存する。そして、画像データを参照するときには、関連付けられた音声データも聞くことができるようにする。
このため、画像取得部31は、画像処理部21から画像データを入力して、音声取得部32に所定タイミング(所定タイミングについては後述する)でタイミング信号を出力する。音声取得部32は、画像取得部31から出力されるタイミング信号に従って、音声入力部9から入力する音声データを分割する。分割された音声データは、スクリーンに投影されている画像データではなく、その画像の前にスクリーンに投影されていた画像データについて話し合われた発言を入力した音声データであるので、投影中の画像データの1つ前に撮影された画像データに関連付けて記録される。
なお、画像データには、画像取得部31で画像データ識別子が付与され、音声データには音声取得部32で音声データ識別子が付与される。画像取得部31は、生成した画像データ識別子を生成順に関連付け処理部33に出力する。同様に音声取得部32は、生成した音声データ識別子を生成順に関連付け処理部33に出力する。関連付け処理部33は、画像取得部31から入力される画像データ識別子と、音声取得部32から入力される音声データ識別子とを関連付けて索引ファイルを作成する。
また、プレゼンテーションの発言者は、資料を見やすく表示するために、スタンド4上の資料の位置や方向を調整したり、ピントを合わせたりすることが多い。さらに、資料上にペンでマーキングや書き込みを行ったり、資料上のある部分をポインティングしたりすることもある。こうした動作によって不要な画像が「変化画像」として多数抽出されることが起こり得る。このような画像を除くため、画像取得部31は、画像処理部21から順次入力される画像データから、直前の画像に対して変化のあった画像を抽出する。また、時間的なしきい値を設定し、一定時間以上変化がなかった画像のみを抽出するようにしてもよい。このとき、画像取得部31は、変化のある画像を入力したことを示すタイミング信号を音声取得部32に出力する。音声取得部32は、画像取得部31からタイミング信号を入力すると、音声入力部9から入力される音声データを区切る。
次に、図5に示すフローチャートを参照しながら画像取得部31の処理手順を説明する。
画像処理部21から画像取得部31に画像データ(プレゼンテーションが開始されて、最初に入力した画像データを以下では基準画像データと呼ぶ)と、この画像データの撮影時間情報とが出力されると(ステップS1)、画像取得部31は、音声取得部32にタイミング信号を出力して画像データの取得を通知する(ステップS2)。画像取得部31は、取得した画像データの特徴量を抽出する(ステップS3)。抽出される特徴量には、カラーヒストグラム、色分布、一様性パターン、ピクセル数とその配列、エッジ数などが挙げられる。また、画像取得部31は、取得した画像データのサムネイル画像を生成する(ステップS4)。
次に、画像取得部31は、取得した画像データと、生成したサムネイル画像とにそれぞれ識別子を付与し、画像データとサムネイル画像とをデータ格納部35に格納する(ステップS5)。
次に、画像取得部31は、基準画像データの撮影時間情報と、画像データとサムネイル画像との識別子と、これらのデータを格納したデータ格納部35のアドレスとを関連付け処理部33に出力する(ステップS6)。
次の画像データ(以下、この画像データを比較対象画像データと呼ぶ)が入力されると(ステップS7/YES)、画像取得部31は、取得した比較対象画像データの特徴量を抽出する(ステップS8)。そして、基準画像データから抽出した特徴量と、比較対象画像データから抽出した特徴量とを比較する(ステップS9)。両者に予め設定された許容範囲以上の差があった場合(ステップS9/NO)、画像取得部31は比較対象画像データを変化のあった画像候補(以下、変化画像候補と呼ぶ)と判定する。変化画像候補を検出すると、画像取得部31は、変化画像候補と、画像処理部21から順次入力される比較対象画像データとの比較を始める(ステップS11)。
位置調整やピント合わせ等の操作が変化画像として検出されないようにするために「変化画像候補」として抽出した画像のうち、所定時間(例えば、4秒)以上変化のなかったものだけを検出する(ステップS12)。所定時間以上変化のなかった画像データを検出すると、画像取得部31は、タイミング信号を音声取得部32に出力する(ステップS13)。また、この画像データを「変化画像」(画像に変化のあった画像)に設定し、画像取得部31は変化画像のサムネイルを作成する(ステップS14)。そして、画像取得部31は、変化画像データと、この変化画像データのサムネイル画像とに識別子を付与し、変化画像データを圧縮する。画像取得部31は、圧縮した変化画像データとサムネイルとをデータ格納部35に格納する(ステップS15)。また、変化画像として検出した画像データと、このサムネイル画像の識別子と、撮影時間情報と、データを格納したデータ格納部35のアドレスとを関連付け処理部33に出力する(ステップS16)。また、検出した変化画像を、次の基準画像データとして、画像処理部21から入力される画像データとの比較を行う(ステップS17)。
また、ステップS12において、所定時間内に特徴量の差がしきい値以上の比較対象画像データを検出した場合には(ステップS12/NO)、変化画像候補の画像データを破棄して、基準画像データと比較対象画像データとの比較を再開する(ステップS18)。また、ステップS7において、比較対象画像データが所定時間を経過しても入力されない場合には(ステップS19/YES)、1回のプレゼンテーションが終了したと判定し、処理を終了する。
このように、データの特徴量に変化が生じた画像データだけを取り込むことで、不要な画像データを保存する必要がなくなり、データ格納部35の容量を無駄に消費することがない。
なお、変化画像の抽出方法は、上述した以外にも種々の方法がある。
第1に、OCR(Optical Character Reader)によって画像データからテキスト情報を抽出し、文字数、文字サイズ、文字の一致性を判定して変化画像の抽出を行うことができる。
第2に、スタンド4上の原稿設置領域5にフォトセンサ(本発明の第2検出手段に該当する)を設けて、資料の切り替えと、そのタイミングとを記録してもよい。
第3に、利用者が行うズームやマーカ表示などによって入力される操作信号に基づいて、直後の画像を変化画像として抽出することもできる。
第4に、撮影指示操作部25の操作によって、ユーザが資料の撮影を指示すると、第1画像入力部2で撮影した画像を画像取得部31で取得するようにしてもよい。
また、以上述べた方法を組み合わせて用いてもよい。
関連付け処理部33は、画像取得部31と音声取得部32とから取得した情報を基に、データ格納部35に格納した索引ファイルの書き換えを行う。関連付け処理部33は、データ格納部35から読み出した索引ファイルに、図4に示すように新たなエントリーテーブルを追加して、必要なデータを書き込む処理を行う。書き換えられた索引ファイルは、データ格納部35に格納される。
次に、取得した画像データと音声データの再生について説明する。
本実施例のドキュメントカメラでは、データ格納部35に格納した画像データのサムネイル表示が可能であり、サムネイル画像をコントロールパネル7から選択することによって、対応する画像データの全画面表示と、音声再生とが可能となる。
再生開始、再生終了、一時停止、巻き戻し、早送りなどの操作は、コントロールパネル7上のボタン操作で行うことができる。なお、サムネイルや画像は、本体スタンド4上部の液晶ディスプレイ6に表示されるが、プロジェクタやディスプレイをドキュメントカメラ1に接続すれば、これらの表示装置でも表示することができる。
次に、サムネイル画像の表示について説明する。ユーザによってコントロールパネル7上の所定ボタンや、液晶ディスプレイ6に表示された所定ボタンが選択されると、再生制御部34は、データ格納部35より索引ファイルを読み出す。そして、索引ファイルの時間(年月日)を参照して、最も新しくデータ格納部35に格納された資料を検出する。再生制御部34は、この最新資料のサムネイル画像をデータ格納部35から読み出して登録データ表示部24に表示させる。
なお、図3に示す液晶ディスプレイ6の例では、左上のサムネイルが選択可能な状態にある。ユーザは、コントロールパネル7を操作して、画像を表示させたいサムネイルを選択可能状態にする。また、同じプレゼン識別子で登録されたサムネイルの表示が終了しても、画像データが選択されない場合、再生制御部34は、次に新しい資料を選択して、このサムネイル画像を表示させる。
サムネイル画像が選択状態にあるときに、所定ボタンが操作されると、再生制御部34は、選択されたサムネイルに対応する画像データと音声データの識別子を索引ファイルから読み出す。再生制御部34は、これらの識別子情報を画像・音声再生部36に通知する。画像・音声再生部36は、再生制御部34から通知された識別子の画像データと音声データとをデータ格納部35から読み出して、展開処理し、画像データを表示装置10に、音声データを音声出力部11に出力する。1組の画像データと音声データの再生が終了すると、同じプレゼン識別子で登録され、再生終了した画像データや音声データよりも時間が1つ新しい画像データ、音声データを読み出す。読み出された画像データは表示装置10に出力され、音声データは音声出力部11に出力される。
上述した実施例1では、スタンド4に載せられたプレゼンテーション資料の画像と、それに対応する発言者の音声とを記録して再生するものであった。
しかしこれらの情報だけでは、発言者が誰なのか、そのとき誰が会議に参加していたのか、どの会議室で行われた会議なのかといったことまでは分からない。
そこで、本実施例では、画像データと音声データに加えて、発言者や会議参加者の顔写真、会議室の様子を撮影し、撮影した画像を資料画像や音声データに対応付けてデータ格納部35に格納する。そして、資料画像や音声の再生時に、発言者や会議参加者の顔画像も一緒に表示できるようにする。
本実施例の構成を図6に示す。図6に示すように本実施例は、スタンド4上に置かれた資料を撮影する第1画像入力部2の他に、発言者、会議参加者や会議室の様子などを撮影する第2画像入力部40を設けている。
第2画像入力部40は、別々の被写体(発言者と会場)を撮影するために複数台設置してもよいし、またカメラをアームに固定せずに三脚を利用してもよい。また、会議参加者が第2画像入力部40としてのカメラを持って撮影してもよい。
また、本実施例は、図7に示すように撮影タイミング制御部37を新たに設けている。撮影タイミング制御部37は、第2画像入力部40の撮影タイミングを管理する。撮影タイミング制御部37の撮影タイミングは、図8に示すように一定時間間隔ごとであってもよいし、撮影タイミング制御部37に、タイムスケジュールを設定しておいて、このタイムスケジュールに従って撮影してもよい。
また、第1画像入力部2の撮影画像に変化画像が抽出された後の一定時間後に撮影してもよいし、各種センサを利用して、センサ値に変化が表れた時に撮影してもよい。例えば、音量センサを設けて、一定以上の音量が検出された時に撮影することができる。なお、第2画像入力部40のカメラで撮影された画像データや、撮影時刻情報は、第2画像入力部40内部の記憶領域に格納しておき、後からドキュメントカメラ1に取り込んでもよいし、無線を利用してリアルタイムにドキュメントカメラ1に転送して保存することもできる。
図9に、関連付け処理部33によって作成された索引ファイルを示す。図9に斜線で示すデータセットは、第2画像入力部25で撮影された画像データを示している。第1画像入力部2で撮影された画像データ及びそのサムネイル画像と、音声入力部9で入力した音声データとのデータセットと同じプレゼン識別子を付与されて、索引ファイルに登録されている。
本実施例は、ドキュメントカメラ1で生成したデータセットを、ネットワークを介して遠隔地のユーザ端末70に配信可能に構成した。本実施例の構成を図10に示す。本実施例は、図10に示すようにURL(Uniform Resource Locator)割り当て部38と、データ取得部39と、データ配信部50と、ネットワークIF部51とをさらに備えている。
URL割り当て部38は、画像取得部31で取得した画像データにURL(サーバ名、ポート番号、フォルダ名、ファイル名など)を割り当てる。割り当てられたURL情報は、関連付け処理部33によって索引ファイルに格納される。
データ配信部50は、ネットワークインターフェース部51を介してユーザ端末70に接続し、ユーザ端末70から入力されたデータの取得要求をデータ取得部39に出力する。データ取得部39は、データ配信部50からの要求に従って、指示された画像データ、音声データ、索引データをデータ格納部35から読み出し、データ配信部50に出力する。データ配信部50は、取得した画像データ、音声データ、索引データを1つの配信データファイルにまとめ、要求元のユーザ端末70に配信する。
ユーザ端末70は、ドキュメントカメラ1から配信データファイルを取得すると、アプリケーションプログラムを起動して、画像の表示、音声の再生を行う。
本実施例は、ドキュメントカメラ1にWebサーバ機能を搭載した。ユーザは、ユーザ端末70にインストールされたインターネットブラウザからURLを指定して、ドキュンメントカメラ1にアクセスする。
ドキュメントカメラ1は、ユーザ端末70からのアクセスを受け付けると、データ配信部50で指定されたHTMLトップ画面をブラウザに返信し、表示する。
ユーザ端末70に表示されるHTMLトップ画面には、格納された画像のサムネイルが表示される。表示されたサムネイルから、ユーザが所望のものを選択すると、選択情報がデータ配信部50からデータ取得部39に送られる。データ取得部39は、データ格納部35にアクセスし、選択されたサムネイルと組になった画像データ、音声データ、索引データを抽出する。所望とする画像データ、音声データ、索引データは、データ配信部50に渡され、1つの配信データファイルにまとめられ、クライアント端末に転送される。なお、データ取得部39での処理は、CGI(Common Gateway Interface)プログラムによって実現することができる。
データ格納部35に多数の画像データや音声データが格納されている場合、サムネイルやファイルの一覧を表示しただけでは、視聴したいデータを見つけ出すのが困難な場合がある。そこで、本実施例では、キーワード検索によって、所望の画像データや音声データを効率的に見つけることができるようにした。
本実施例の構成を図11に示す。図11に示すように本実施例は、画像取得部31で取得した画像データに対して、文字認識部60が文字認識処理を行い、テキスト情報を取り出す。さらに、抽出したテキスト情報に対して形態素解析を行って、テキスト情報を形態素に分離する。
また、音声取得部32で取得した音声データに対して、音声認識部61が音声認識処理を行い、テキスト情報を抽出する。さらに、抽出したテキスト情報に対して形態素解析を行って、テキスト情報を形態素に分離する。
関連付け処理部33は、画像データと音声データの形態素を索引ファイルに登録する。なお、画像から抽出した形態素と、音声から抽出した形態素とを区別して索引ファイルに登録してもよい。こうすることによって、画像と音声の情報ソースを区別したキーワード検索が可能となる。
図12には、キーワード検索によってユーザ端末70に表示されるインターフェース画面を示す。図12に示すインターフェース画面には、キーワードを入力する入力欄と、検索対象のデータを画像だけにするか、音声だけにするか、画像と音声の両方にするのかを選択するチェックボックスと、検索結果とが表示されている。検索の結果、キーワードを含む画像データが検出された場合には、画像データのサムネイル画像が検索結果として表示される。音声データだけが検索された場合には、会議のIDや、記録日時、記録場所等のデータを表示してもよい。また、検出されたデータの種別も表示されるとよい。すなわち、画像データと音声データの両方が検出されたのか、画像データだけが検出されたのか、音声データだけが検出されたのかを表示する。
上述した実施例は本発明の好適な実施の例である。但し、これに限定されるものでなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
実施例1のドキュメントカメラの外観を示す図である。 実施例1のドキュメントカメラの詳細な構成を示す機能ブロック図である。 コントロールパネルと液晶ディスプレイとの構成を示す図である。 実施例1の索引ファイルの構成を示す図である。 画像取得部31の処理手順を示すフローチャートである。 実施例2のドキュメントカメラの外観を示す図である。 実施例2のドキュメントカメラの詳細な構成を示す図である。 第1画像入力部と第2画像入力部の画像記録タイミングを示す図である。 実施例2の索引ファイルの構成を示す図である。 実施例3のドキュメントカメラの詳細な構成を示す図である。 実施例4のドキュメントカメラの詳細な構成を示す図である。 ユーザ端末に表示されるインターフェース画面の一例を示す図である。
符号の説明
1 ドキュメントカメラ
2 画像入力部
3 フレキシブルアーム
4 スタンド
5 原稿設置領域
6 液晶ディスプレイ
7 コントロールパネル
8 マイク端子
9 マイク
10 表示装置
21 画像処理部
22 記録開始・終了操作部
23 再生制御情報入力部
24 登録データ表示部
25 撮影指示操作部
31 画像取得部
32 音声取得部
33 関連付け処理部
34 再生制御部
35 データ格納部
36 画像・音声再生部
37 撮影タイミング制御部
38 URL割り当て部
39 データ取得部
40 第2画像入力部

Claims (11)

  1. スクリーンに投影される投影用の画像データを撮影するドキュメントカメラ装置であって、
    投影される画像データの切り替えタイミングを検出する検出手段と、
    発言者の音声を音声データとして取り込む音声入力手段と、
    前記検出手段の検出した切り替えタイミングに応じて前記音声データを分割する分割手段と、
    前記投影用の画像データと、該画像データの投影中に入力した音声データとを関連付けて、記憶手段に格納する関連付け手段と、
    を有することを特徴とするドキュメントカメラ装置。
  2. 前記検出手段は、撮影された画像データを順次入力し、直前の画像データと比較して画像に変化のある画像を検出して、前記切り替えタイミングを検出することを特徴とする請求項1記載のドキュメントカメラ装置。
  3. 前記投影用の画像データを撮影する第1撮影手段を備え、
    前記検出手段は、前記第1撮影手段に撮影を指示する操作手段からの操作入力を検出して、前記切り替えタイミングを検出することを特徴とする請求項1記載のドキュメントカメラ装置。
  4. 前記投影用の画像データと、該画像データに関連付けられた音声データとを前記記憶手段から読み出して、再生させる再生制御手段を有することを特徴とする請求項1から3のいずれか一項記載のドキュメントカメラ装置。
  5. 発言者や会議室の様子を撮影する第2撮影手段を備え、
    前記関連付け手段は、前記第2撮影手段で撮影された画像データと、前記投影用の画像データとを関連付けて、前記記憶手段に格納することを特徴とする請求項1から4のいずれか一項記載のドキュメントカメラ装置。
  6. 前記検出手段は、画像データの画像特徴量を抽出し、該画像特徴量と前記直前の画像データの画像特徴量とを比較することで、前記画像に変化のある画像データを検出することを特徴とする請求項2記載のドキュメントカメラ装置。
  7. 前記検出手段は、画像のカラーヒストグラムと、色分布と、濃度一様な画像パターン数と、画素数と画素配列と、画像のエッジ数との少なくとも1つを前記画像特徴量として抽出することを特徴とする請求項6記載のドキュメントカメラ装置。
  8. 前記検出手段は、画像データから抽出したテキスト情報と、前記直前の画像データから抽出したテキスト情報とを比較して、前記画像に変化のある画像データを検出することを特徴とする請求項2記載のドキュメントカメラ装置。
  9. 前記投影用の画像データを撮影する第1撮影手段を備え、
    前記検出手段は、前記第1撮影手段の撮影位置に資料が配置されているか否かを検出する第2検出手段からの信号を入力して、前記切り替えタイミングを検出することを特徴とする請求項1から8のいずれか一項記載のドキュメントカメラ装置。
  10. 撮影された画像データのサムネイル画像を作成するサムネイル作成手段を有し、
    前記関連付け手段は、前記サムネイル画像を、該サムネイル画像の作成元の画像データに関連付けて前記記憶手段に格納することを特徴とする請求項1から9のいずれか一項記載のドキュメントカメラ装置。
  11. 撮影された画像データからテキスト情報を抽出し、形態素解析を行って前記テキスト情報から分離した形態素を前記記憶手段に格納する文字認識手段と、
    前記音声入力手段から入力された音声データに対して、音声認識処理を行ってテキスト情報を抽出し、形態素解析を行って前記テキスト情報から分離した形態素を前記記憶手段に格納する音声認識手段とを有し、
    前記関連付け手段は、前記形態素を、該形態素を検出した画像データや音声データに関連付けて前記記憶手段に格納し、
    検索語を含む画像データ又は音声データを前記記憶手段から検索する検索手段を有することを特徴とする請求項1から10のいずれか一項記載のドキュメントカメラ装置。
JP2006174631A 2006-06-23 2006-06-23 ドキュメントカメラ装置 Expired - Fee Related JP4876736B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006174631A JP4876736B2 (ja) 2006-06-23 2006-06-23 ドキュメントカメラ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006174631A JP4876736B2 (ja) 2006-06-23 2006-06-23 ドキュメントカメラ装置

Publications (2)

Publication Number Publication Date
JP2008005359A true JP2008005359A (ja) 2008-01-10
JP4876736B2 JP4876736B2 (ja) 2012-02-15

Family

ID=39009353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006174631A Expired - Fee Related JP4876736B2 (ja) 2006-06-23 2006-06-23 ドキュメントカメラ装置

Country Status (1)

Country Link
JP (1) JP4876736B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014107826A (ja) * 2012-11-29 2014-06-09 Seiko Epson Corp 書画カメラ、映像音声出力システムおよび映像音声出力方法
JP2015211377A (ja) * 2014-04-28 2015-11-24 富士通株式会社 画像検索装置、画像検索方法及びプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05298368A (ja) * 1992-04-23 1993-11-12 Matsushita Electric Ind Co Ltd 電子ファイリングシステムの検索語入力方法
JP2002109099A (ja) * 2000-09-28 2002-04-12 Nippon Telegraph & Telephone West Corp 資料と映像・音声の記録システム、装置及びコンピュータ読み取り可能な記録媒体
JP2004208232A (ja) * 2002-12-26 2004-07-22 Minolta Co Ltd 撮像装置
JP2005079727A (ja) * 2003-08-28 2005-03-24 Casio Comput Co Ltd 撮影画像投影装置
JP2005236432A (ja) * 2004-02-17 2005-09-02 Ricoh Co Ltd 画像入力装置及び画像データ管理装置
JP2005284196A (ja) * 2004-03-31 2005-10-13 Seiko Epson Corp プロジェクタを用いたプレゼンテーションの記録、再生および配信制御

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05298368A (ja) * 1992-04-23 1993-11-12 Matsushita Electric Ind Co Ltd 電子ファイリングシステムの検索語入力方法
JP2002109099A (ja) * 2000-09-28 2002-04-12 Nippon Telegraph & Telephone West Corp 資料と映像・音声の記録システム、装置及びコンピュータ読み取り可能な記録媒体
JP2004208232A (ja) * 2002-12-26 2004-07-22 Minolta Co Ltd 撮像装置
JP2005079727A (ja) * 2003-08-28 2005-03-24 Casio Comput Co Ltd 撮影画像投影装置
JP2005236432A (ja) * 2004-02-17 2005-09-02 Ricoh Co Ltd 画像入力装置及び画像データ管理装置
JP2005284196A (ja) * 2004-03-31 2005-10-13 Seiko Epson Corp プロジェクタを用いたプレゼンテーションの記録、再生および配信制御

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014107826A (ja) * 2012-11-29 2014-06-09 Seiko Epson Corp 書画カメラ、映像音声出力システムおよび映像音声出力方法
JP2015211377A (ja) * 2014-04-28 2015-11-24 富士通株式会社 画像検索装置、画像検索方法及びプログラム

Also Published As

Publication number Publication date
JP4876736B2 (ja) 2012-02-15

Similar Documents

Publication Publication Date Title
JP4640456B2 (ja) 画像記録装置、画像記録方法、画像処理装置、画像処理方法、プログラム
US6229566B1 (en) Electronic photography system
JP4468956B2 (ja) 連続画像を記録するカメラ
CN103248818A (zh) 图像撷取方法与相关图像撷取系统
US20140211046A1 (en) Apparatus and Method for Processing Digital Image
JP2007148691A (ja) 画像処理装置
JP2014050022A (ja) 画像処理装置、撮像装置、およびプログラム
JP2003111009A (ja) 電子アルバム編集装置
JP2004247983A (ja) 撮影装置及び画像処理装置並びに画像処理プログラム
JP2006094082A (ja) 画像撮影装置およびプログラム
US9767587B2 (en) Image extracting apparatus, image extracting method and computer readable recording medium for recording program for extracting images based on reference image and time-related information
US10447935B2 (en) Image generating apparatus, image generating method and computer readable recording medium for recording program for generating new image from images related to reference image
JP2007329521A (ja) 画像再生システム、デジタルカメラ、および画像再生装置
JP2006086823A (ja) 画像記録装置、画像検索方法、画像採点方法及び画像採点システム
JP2010068207A (ja) 撮像装置、方法およびプログラムならびに撮像システム
JP4876736B2 (ja) ドキュメントカメラ装置
JP2016001821A (ja) コンテンツ再生システム、サーバ、携帯端末、コンテンツ再生方法、プログラムおよび記録媒体
JP2011119936A (ja) 撮影装置及び再生方法
KR20100093955A (ko) 디지털 영상신호 처리장치에서 이미지확대표시방법
GB2413718A (en) Automatic view generation from recording photographer's eye movements
JP5325012B2 (ja) 歌唱者画像撮影機能を有するカラオケシステム
JP2010262072A (ja) デジタルテレビ対応カラオケシステム
CN109474782B (zh) 用于数据编辑的接口装置、数据编辑方法、记录介质
KR101978168B1 (ko) 동영상 콘텐츠의 실시간 제작 방법
JP2004180181A (ja) 撮像装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111101

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111114

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141209

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees