JP6276570B2 - 画像音声再生システム及び画像音声再生方法とプログラム - Google Patents
画像音声再生システム及び画像音声再生方法とプログラム Download PDFInfo
- Publication number
- JP6276570B2 JP6276570B2 JP2013252416A JP2013252416A JP6276570B2 JP 6276570 B2 JP6276570 B2 JP 6276570B2 JP 2013252416 A JP2013252416 A JP 2013252416A JP 2013252416 A JP2013252416 A JP 2013252416A JP 6276570 B2 JP6276570 B2 JP 6276570B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- time
- data
- image object
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
ユーザーによる発話の音声データを含む、前記時系列の静止画像データに対応する時系列の音声データを取得する音声取得手段と、
前記画像オブジェクトを発話のタイミングと関連付ける関連付け手段と、
前記画像オブジェクトを含む静止画像データを表示する表示手段と、
前記表示された画像オブジェクトがユーザーの指示により選択された場合に、前記関連付けにより前記画像オブジェクトに関連付けられた前記発話のタイミングから、前記時系列の静止画像データおよび前記時系列の音声データを再生する再生手段と、
を有することを特徴とする画像音声再生システムにある。
あるいは他の側面によれば、本発明は、動画像データに含まれたフレームの間の差分に基づいて、画像オブジェクトの現れるフレームと、該画像オブジェクトが現れる前のフレームとにより前記画像オブジェクトの書込み期間を特定し、前記動画像データに同期して記録された音声のうちから、発話区間の少なくとも一部が、前記書込み期間に対して一定時間内である音声を、前記画像オブジェクトに関連付ける関連付け手段と、
前記画像オブジェクトが選択された場合に、前記関連付けにより前記画像オブジェクトに関連付けられた前記音声の発話区間の開始時刻から、前記動画像データを、同期して記録された音声とともに再生する再生手段と
を有することを特徴とする画像音声再生システムにある。
始めに本発明の実施の形態の適用が想定される場面について説明する。例えば会議参加者がそれぞれホワイトボードなどの盤面(以下、ホワイトボードあるいは描画先)に文字や図形などを書き込む会議を行うことがある。このような会議において、会議の内容を記録する方法としては、ホワイトボードの様子を撮影(あるいは撮像)して静止画として残す方法がある。しかし会議中の細かな会話の内容や議論の経緯などは文字や図形で残りにくく、後から記録を参照しても思い出すことが困難であることが多い。そこで本実施形態では、会議の内容を音声付きの動画像で全て記録しておき、後から参照するシステムを提供する。これにはホワイトボードの静止画像から任意の知りたい書込み(すなわち書き込まれた画像オブジェクト)の領域を選択し、動画像の任意の再生開始時刻から再生されるようにすることで動画参照や音声視聴の補助を行う。
図1は本実施形態における映像撮影再生システム(あるいは画像音声再生システム)のハードウエア構成例を示したものである。図示するようにこの映像撮影再生システムは、情報処理装置10と、ホワイトボード11と、ビデオカメラ12と、マイクロフォン13によって構成されている。情報処理装置10は、ビデオカメラ12がホワイトボード11を撮影した動画像、およびマイクロフォン13から送られてくる音声を保存し、後述する処理を行い内蔵する表示装置で静止画像や動画像の表示を行う。この情報処理装置10は、ビデオカメラとマイクロフォンが接続できるパーソナルコンピュータやワークステーションだけでなく、それらを内蔵するタブレットに代表される一体型コンピュータシステムを用いても良い。
図3は、映像撮影再生システムを機能構成で示したものである。制御部30は、後述する関連情報生成処理300と映像再生処理301で構成されている。関連情報生成処理300は、以下の処理ユニットによって構成されている。動画受信部3000は、時系列で画像取得する動画撮影部32から動画像を受信して2次記憶部31へ動画像データ310として保存する。静止画抽出部3001は動画像データ310から所定のタイミングで静止画像を取り出し、静止画像データ311として図6のようにIDを1から順に付与して保存する。静止画像を取り出すタイミングについては、例えばユーザーが操作部34を用いて手動で指示したタイミングを用いて取り出したり、図示しない時刻計数部を用いて一定時刻間隔で取り出したりすることが考えられる。本実施形態では、ユーザーが操作部34を用いて手動で指示したタイミングを用いて動画像データ310から静止画像311を抽出すると仮定する。静止画抽出部3001は、撮影対象である描画先を撮像した時系列の画像データを取得する画像取得手段として機能する。なお、動画撮影部32は、動画像と同期した音声データを記録する。
図5は、前述の静止画抽出処理によって得られた静止画像を時系列順に比較し、差分領域情報を生成する処理をフローチャートにしたものである。S601からS605までの処理を静止画像のIDの値を1で初期化し、繰り返しごとにIDの値を加算しながら、比較する静止画像が存在する範囲で繰り返し実行する。S602では、先行するID番目の静止画像と、それに続く(ID + 1)番目の静止画像とを比較することで静止画像の差分抽出を行う。S603では抽出結果から差分の有無を判断する。なお静止画像のIDがシリアル番号でない場合には、IDとして静止画像の時系列の順序を示す番号を利用すればよい。
図12は前述した差分領域情報312と発話期間情報313を関連付けるフローである。図12においては、ID=1の差分領域情報(図7(a)参照)から順次着目し、S1701〜S1714までの処理を行う。なお発話情報が、処理対象の動画情報から別途抽出されているものとする。発話情報は、一連の音声が開始される開始時刻と当該音声が終了する終了時刻とから構成される発話時刻と、IDとを含む。さらに音声情報そのものを含んでもよい。まずS1701において、着目した差分領域情報を取り出す(すなわち参照する)。S1702において着目差分領域のひとつ前のID(ID=1の場合は存在しない)の着目差分領域の誤記フラグ85を参照し、誤記フラグ85が無いもしくは'0'の場合はS1704に進み、着目差分領域が非下地領域かの判断を行う。非下地領域であればS1705に進み、書込みの開始時刻から終了時刻まで(以下、書込み期間あるいは描画期間と呼ぶ)と、開始時刻から終了時刻まで(以下、発話期間と呼ぶ)の重なる発話があるかを判断する(S1705)。なお書込みの開始時刻とは、着目差分領域情報の再生開始時刻82に相当し、書込み終了時刻とは着目差分領域情報の静止画像時刻情報83に相当する。発話期間が書込み時間に重なるような発話がある場合は、該当する発話すべてを着目差分領域に紐付ける(S1706)。この関連付けは図14に示すような書込み−音声表に記録される。書込み−音声表では、関連付けの対象となる差分領域のID80とその領域情報81、関連付けられる発話を特定する情報(例えばID)とその最優先の発話識別情報とが1レコードを構成する。発話情報のIDは、図7(b)の発話情報のID160に相当する。最優先の発話情報とは、一つの差分領域に複数所発話が関連付けられる場合に最優先される優先順位であり、書込み期間と重複している期間が最も長い発話が最優先の発話に指定される。そのためにひとつのIDに紐付いている発話がひとつかどうかの判断を行う(S1707)。複数ある場合には、紐付けられる複数の発話の書き込み期間との重複の長さを比較する。最も書込み期間との重複期間が長い発話のIDが最優先の発話欄に記録される(S1708)。この紐づけは、差分領域に表れた画像オブジェクトを、その書込み期間に発話された音声に関連付けることということができる。
図9は、前述の差分領域情報と動画像とを利用して任意の再生開始時刻から動画像の再生を行う処理をフローチャートにしたものである。まずS1001において、最終静止画像の表示を行う。この最終静止画像とは、保存した動画像の最終静止画像のことであり、静止画像例の図6ではP(8)であるため、最終的な表示例は図10のようになる。次にS1002で、ユーザーの操作部34に対する操作による座標情報の入力を待つ。入力される座標情報は、表示されている静止画像上の座標である。入力があった場合にはS1003で、入力された座標情報を基に差分領域情報(図7参照)を走査する。より具体的には、入力された座標情報が差分領域情報内の領域情報81に保存された各領域内に含まれているか否か走査する。すなわち、差分領域情報に登録された静止画像すべてについて、入力された座標を含む領域情報を検索する。次にS1004で、その走査の結果該当する領域情報がないと判断された場合には、S1002で再びユーザーの操作入力を待つ。
実施形態2では領域情報81と発話情報161の紐付けを行う際に、更に容易な方法で紐付けを行う方法について説明する。図15は本実施形態における領域情報と発話情報とを紐付ける処理をフローチャートにしたものであり、実施形態1の図12に代えて本実施形態で遂行される手順である。そのほかの構成は実施形態1に準ずる。
なお本発明は、上記実施の形態に限定されず、本発明の要旨を逸脱しない範囲で種々の変形が可能である。例えば図1のハードウエア構成例に、ホワイトボードを撮影するビデオカメラだけでなく会議参加者の様子を撮影するビデオカメラを追加し動画像を2種類保存し、動画像の再生時にピクチャーインピクチャーで両方の動画像を同時に再生してもよい。これにより会議の会話だけでなく参加者の様子も同時に確認できるため、より詳細な事後確認が可能になる。
Claims (13)
- 画像オブジェクトが描画先に描画されていない状態から前記画像オブジェクトが前記描画先に描画された状態になるまでの前記描画先を撮像した時系列の静止画像データを取得する画像取得手段と、
ユーザーによる発話の音声データを含む、前記時系列の静止画像データに対応する時系列の音声データを取得する音声取得手段と、
前記画像オブジェクトを発話のタイミングと関連付ける関連付け手段と、
前記画像オブジェクトを含む静止画像データを表示する表示手段と、
前記表示された画像オブジェクトがユーザーの指示により選択された場合に、前記関連付けにより前記画像オブジェクトに関連付けられた前記発話のタイミングから、前記時系列の静止画像データおよび前記時系列の音声データを再生する再生手段と、
を有することを特徴とする画像音声再生システム。 - 前記画像取得手段は、動画像から所定のタイミングで静止画像を抽出することで前記時系列の静止画像データを取得し、
前記音声取得手段は、前記動画像に同期して記録された音声から、無音区間で区切られた発話区間ごとに音声を抽出することで前記音声データを取得し、
前記関連付け手段は、先行する静止画像データとそれに続く静止画像データとの差分に含まれた画像オブジェクトを、前記先行する静止画像データが抽出されたタイミングから前記それに続く静止画像データが抽出されたタイミングまでの描画期間と発話区間が重複する前記音声データに関連付けることを特徴とする請求項1に記載の画像音声再生システム。 - 前記関連付け手段はさらに、前記描画期間を前後に拡張した拡張描画期間と発話区間が重複する前記音声データも前記画像オブジェクトに関連付けることを特徴とする請求項2に記載の画像音声再生システム。
- 前記関連付け手段は、前記差分に含まれた画像オブジェクトが誤記であるか判定し、誤記であった場合には、誤記であると判定された前記画像オブジェクトに関連付けられた音声データを、誤記であると判定された画像オブジェクトの消去の後に書き込まれた画像オブジェクトに関連付けることを特徴とする請求項2又は3に記載の画像音声再生システム。
- 前記関連付け手段は、前記差分に含まれた画像オブジェクトが下地色であり、前記先行する静止画像データの更に先行する静止画像データに、前記画像オブジェクトと重複する画像オブジェクトが含まれている場合に、当該画像オブジェクトを、誤記であると判定された前記画像オブジェクトとすることを特徴とする請求項4に記載の画像音声再生システム。
- 前記関連付け手段は、前記画像オブジェクトに関連付けた音声データが複数あった場合には、そのうちのひとつを最優先の音声データとして前記画像オブジェクトに関連付け、前記再生手段は、最優先の音声データを再生することを特徴とする請求項1乃至5のいずれか一項に記載の画像音声再生システム。
- 前記関連付け手段は、前記最優先の音声データとして、前記画像オブジェクトの描画期間と最も長く重複する発話区間の音声データを前記画像オブジェクトに関連付けることを特徴とする請求項6に記載の画像音声再生システム。
- 前記関連付け手段は、前記最優先の音声データとして、前記画像オブジェクトの描画期間に最も近い発話区間の音声データを前記画像オブジェクトに関連付けることを特徴とする請求項6に記載の画像音声再生システム。
- 前記画像取得手段は、動画像から所定のタイミングで静止画像を抽出することで前記時系列の静止画像データを取得し、
前記音声取得手段は、前記動画像に同期して記録された音声から、無音区間で区切られた発話区間ごとに音声を抽出することで前記音声データを取得し、
前記関連付け手段は、先行する静止画像データとそれに続く静止画像データとの差分に含まれた画像オブジェクトを、前記先行する静止画像データが抽出されたタイミングから前記それに続く静止画像データが抽出されたタイミングまでの描画期間の中の所定の特徴点時刻と発話区間の中の所定の特徴点時刻が最も近い前記音声データに関連付けることを特徴とする請求項1に記載の画像音声再生システム。 - 前記特徴点時刻は、前記描画期間及び前記発話区間の、開始時刻または終了時刻または中間時刻のいずれかであることを特徴とする請求項9に記載の画像音声再生システム。
- 動画像データに含まれたフレームの間の差分に基づいて、画像オブジェクトの現れるフレームと、該画像オブジェクトが現れる前のフレームとにより前記画像オブジェクトの書込み期間を特定し、前記動画像データに同期して記録された音声のうちから、発話区間の少なくとも一部が、前記書込み期間に対して一定時間内である音声を、前記画像オブジェクトに関連付ける関連付け手段と、
前記画像オブジェクトが選択された場合に、前記関連付けにより前記画像オブジェクトに関連付けられた前記音声の発話区間の開始時刻から、前記動画像データを、同期して記録された音声とともに再生する再生手段と
を有することを特徴とする画像音声再生システム。 - 画像オブジェクトが描画先に描画されていない状態から前記画像オブジェクトが前記描画先に描画された状態になるまでの前記描画先を撮像した時系列の静止画像データを取得する画像取得工程と、
ユーザーによる発話の音声データを含む、前記時系列の静止画像データに対応する時系列の音声データを取得する音声取得工程と、
前記画像オブジェクトを発話のタイミングと関連付ける関連付け工程と、
前記画像オブジェクトを含む静止画像データを表示する表示工程と、
前記表示された画像オブジェクトがユーザーの指示により選択された場合に、前記関連付けにより前記画像オブジェクトに関連付けられた前記発話のタイミングから、前記時系列の静止画像データおよび前記時系列の音声データを再生する再生工程と、
を有する画像音声再生方法。 - 請求項1乃至11のいずれか一項に記載の画像音声再生システムをコンピュータにより実現するためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013252416A JP6276570B2 (ja) | 2013-12-05 | 2013-12-05 | 画像音声再生システム及び画像音声再生方法とプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013252416A JP6276570B2 (ja) | 2013-12-05 | 2013-12-05 | 画像音声再生システム及び画像音声再生方法とプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015109612A JP2015109612A (ja) | 2015-06-11 |
JP2015109612A5 JP2015109612A5 (ja) | 2017-01-19 |
JP6276570B2 true JP6276570B2 (ja) | 2018-02-07 |
Family
ID=53439666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013252416A Expired - Fee Related JP6276570B2 (ja) | 2013-12-05 | 2013-12-05 | 画像音声再生システム及び画像音声再生方法とプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6276570B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7114908B2 (ja) * | 2018-01-19 | 2022-08-09 | 株式会社リコー | 情報処理システム、情報処理装置、情報処理方法、および情報処理プログラム |
JP7210908B2 (ja) | 2018-06-05 | 2023-01-24 | ソニーグループ株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7447908B2 (ja) | 2019-10-17 | 2024-03-12 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP7468693B2 (ja) | 2020-11-17 | 2024-04-16 | 日本電信電話株式会社 | 文字情報付与方法、文字情報付与装置及びプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3757880B2 (ja) * | 2002-03-07 | 2006-03-22 | ヤマハ株式会社 | 電子黒板 |
US7260257B2 (en) * | 2002-06-19 | 2007-08-21 | Microsoft Corp. | System and method for whiteboard and audio capture |
JP2005167822A (ja) * | 2003-12-04 | 2005-06-23 | Canon Inc | 情報再生装置及び情報再生方法 |
JP2005284490A (ja) * | 2004-03-29 | 2005-10-13 | Sharp Corp | データ記録装置およびデータ再生装置 |
JP4577012B2 (ja) * | 2004-12-28 | 2010-11-10 | カシオ計算機株式会社 | 音声画像再生装置、音声画像再生方法及びプログラム |
US8639032B1 (en) * | 2008-08-29 | 2014-01-28 | Freedom Scientific, Inc. | Whiteboard archiving and presentation method |
JP5522369B2 (ja) * | 2009-12-25 | 2014-06-18 | 日本電気株式会社 | 会議記録要約システム、会議記録要約方法及びプログラム |
-
2013
- 2013-12-05 JP JP2013252416A patent/JP6276570B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015109612A (ja) | 2015-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4175390B2 (ja) | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム | |
JP6276570B2 (ja) | 画像音声再生システム及び画像音声再生方法とプログラム | |
WO2004002144A1 (ja) | メタデータ作成装置、その作成方法および検索装置 | |
JP5206553B2 (ja) | 閲覧システム、方法、およびプログラム | |
JP2007066018A (ja) | 情報処理方法及び情報処理装置 | |
JP5522369B2 (ja) | 会議記録要約システム、会議記録要約方法及びプログラム | |
JP5164426B2 (ja) | 表示制御装置および表示制御方法 | |
JP2012178028A (ja) | アルバム作成装置、アルバム作成装置の制御方法、及びプログラム | |
JP2010061343A (ja) | 音声記録方法、音声再生方法、音声記録プログラム、音声再生プログラム | |
JP2016063477A (ja) | 会議システム、情報処理方法、及びプログラム | |
JP6261198B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP2000222417A (ja) | 画像ファイリング装置 | |
JP5310682B2 (ja) | カラオケ装置 | |
JP2009283020A (ja) | 記録装置、再生装置、及びプログラム | |
JP2005167822A (ja) | 情報再生装置及び情報再生方法 | |
JP7133367B2 (ja) | 動画編集装置、動画編集方法、及び動画編集プログラム | |
US20200075025A1 (en) | Information processing apparatus and facilitation support method | |
KR101562901B1 (ko) | 대화 지원 서비스 제공 시스템 및 방법 | |
JP2007078985A (ja) | データ検索装置及びその制御方法 | |
JP6802264B2 (ja) | 表示装置、出力装置、および情報表示方法 | |
JP7423164B2 (ja) | カラオケ装置 | |
US10714146B2 (en) | Recording device, recording method, reproducing device, reproducing method, and recording/reproducing device | |
KR20220001657A (ko) | 영상 편집 장치 | |
KR20220001658A (ko) | 영상 편집 방법 | |
JP2022055144A (ja) | ワークショップにおけるボードの映像再生装置、オンライン/オンサイトボードシステム、プログラム及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161205 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171016 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180112 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6276570 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |