JP2015233188A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2015233188A5 JP2015233188A5 JP2014118607A JP2014118607A JP2015233188A5 JP 2015233188 A5 JP2015233188 A5 JP 2015233188A5 JP 2014118607 A JP2014118607 A JP 2014118607A JP 2014118607 A JP2014118607 A JP 2014118607A JP 2015233188 A5 JP2015233188 A5 JP 2015233188A5
- Authority
- JP
- Japan
- Prior art keywords
- information
- moving image
- frame
- processing apparatus
- specific instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003384 imaging method Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 8
- 230000002596 correlated Effects 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 claims description 2
- 238000003672 processing method Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000000875 corresponding Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Description
なお、第3の撮影端末30は、第1の撮影端末10または第2の撮影端末20と同様に構成してもよく、これらとは異なる構成であってもよい。また、これらの端末の制御は、それぞれ端末自体で行ってもよく、端末と通信可能に接続されたサーバや他の端末により行われてもよい。
[1.2.機能構成]
次に、本開示における情報処理装置の機能を有する装置による動画像の処理について説明する。本実施形態では、本開示における情報処理装置の機能を、撮影端末が備えるものとして説明するが、例えば撮影端末により取得された動画像がアップロードされるサーバが備えてもよい。図4に、撮影端末100およびサーバ200の機能構成の一例を示す。
次に、本開示における情報処理装置の機能を有する装置による動画像の処理について説明する。本実施形態では、本開示における情報処理装置の機能を、撮影端末が備えるものとして説明するが、例えば撮影端末により取得された動画像がアップロードされるサーバが備えてもよい。図4に、撮影端末100およびサーバ200の機能構成の一例を示す。
音声取得部120は、音声データを取得する機能部であり、例えばマイク等を用いることができる。音声取得部120は、制御部140により撮像部110と連動して機能するように制御されることで、撮像部110により取得された画像データに対応する音声データを取得することができる。音声取得部120は、単体で機能することもでき、その場合には撮影端末100は音声データのみを取得する。音声取得部120により取得された音声データは、制御部140により記憶部170に記録される。
特定指示情報抽出部152は、音声データを解析して特定指示情報を抽出する。特定指示情報は、画像データにおいてユーザが後から確認したい画像(フレーム)を抽出するために用いる情報である。本実施形態では、特定指示情報として、予め設定された特定コマンドを抽出する。特定コマンドは、例えば記憶部170に予め記憶されている。特定指示情報抽出部152は、音声データから特定コマンドを抽出し、フレーム抽出部154へ出力する。
フレーム特定情報付与部156は、フレーム抽出部154により抽出されたフレームに対して、当該フレームを特定するためのフレーム特定情報を付与する。フレーム特定情報は、ユーザが後から確認したい画像(フレーム)が存在する画像データ中の時間位置を特定する情報である。フレーム特定情報付与部156によってフレーム特定情報が付与された画像データは、制御部140によって記憶部170に記録される。
特定コマンドの例を図8に示す。図8に示す例では、例えば“Record 〜〜”という特定コマンドを用いて、抽出したいフレームの時間位置の指定や、抽出する特定の人物、物体、場所等の指定を行うことができる。このとき、特定指示情報抽出部152は、少なくとも“Record”に続く音声内容を確認し、画像データから当該特定コマンドで指定された内容を認識する。また、“Stop record”のように先の特定コマンドを停止させる特定コマンド等もある。特定コマンドには、“Capture”、“Reproduce”、“Move”、“Select”等のように、フレームの特定の仕方や機器操作等に関するコマンドを含んでもよい。
すなわち、例えば「さっきの時点」に対応する所定時間が10分、起点を基準とした前後の時間が10分に設定されている場合、特定コマンドが発生されてから10分前を起点とし、その前後5分ずつ、または、10分前から現在までの期間のフレームが抽出される。あるいは、フレーム抽出部154は、起点以後のフレームを指示があるまで継続して抽出対象としてもよい(期間C)。この「さっきの時点」に対応する所定時間及び起点を基準とした前後時間は任意に設定可能である。
なお、本実施形態では、特定指示情報として、音声データに含まれるユーザの発話内容や周囲の音声に含まれる所定の音声内容を用いる場合について説明したが、これらの情報に加えて、第1の実施形態にて利用した特定コマンドを含めてもよい。
例えば、上記実施形態では、画像データの解析処理、フレーム特定情報の付与処理を撮影端末100で行ったが、本技術はかかる例に限定されず、サーバ200側で行ってもよい。この場合、撮影端末100により画像データおよび音声データが取得されると、所定のタイミングでこれらのデータがサーバ200へ送信される。データ送信のタイミングは、例えば、ユーザが操作して撮影端末100をサーバ200に接続した時や、所定の時間間隔等としてもよい。あるいはリアルタイムに撮影端末100からサーバ200へデータ送信してもよい。サーバ200は、画像データおよび音声データを受信すると、制御部220は、演算部230に対して、画像データへ特定フレーム情報を付与する処理を実行するよう指示する。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
入力された音声に応じて設定される特定指示情報に基づき、動画像における1または複数のフレームを抽出し、前記抽出されたフレームを特定するフレーム特定情報を記憶部に記録させる処理部を備える、情報処理装置。
(2)
前記特定指示情報は、入力された音声を解析して設定される、前記(1)に記載の情報処理装置。
(3)
前記音声は、前記動画像の取得とともに取得された音声である、前記(2)に記載の情報処理装置。
(4)
前記特定指示情報は、予め設定された特定コマンドである、前記(1)〜(3)のいずれか1項に記載の情報処理装置。
(5)
前記特定指示情報には、時間情報が含まれる、前記(1)〜(4)のいずれか1項に記載の情報処理装置。
(6)
前記処理部は、動画像の各フレームと前記特定指示情報との相関を解析する、前記(1)〜(5)のいずれか1項に記載の情報処理装置。
(7)
前記処理部は、前記相関が所定よりも高い場合に、前記1または複数のフレームの抽出を行う、前記(6)に記載の情報処理装置。
(8)
前記処理部は、前記動画像に付加されている付加情報を用いて、前記動画像から前記特定指示情報と相関のある1または複数のフレームを抽出する、前記(6)に記載の情報処理装置。
(9)
前記付加情報は、動画像を取得したときの位置情報、予め登録された顔画像と照合した人物情報、シーン情報のうち少なくともいずれか1つを含む、前記(8)に記載の情報処理装置。
(10)
前記処理部は、前記動画像を機械学習した結果として得られた推測情報に基づき、前記動画像から前記特定指示情報と相関のある1または複数のフレームを抽出する、前記(6)に記載の情報処理装置。
(11)
前記処理部は、前記特定指示情報に基づいて抽出された1または複数のフレームを表示部に表示させる、前記(1)〜(10)のいずれか1項に記載の情報処理装置。
(12)
動画像を取得する撮像部を備える、前記(1)〜(11)のいずれか1項に記載の情報処理装置。
(13)
前記処理部は、前記フレーム特定情報とともに、動画像の各フレームと前記特定指示情報との相関の程度を示す情報も前記記憶部に記録させる、前記(1)〜(12)のいずれか1項に記載の情報処理装置。
(14)
前記処理部は、前記抽出された1または複数のフレームを候補フレームとして表示部に提示させる、前記(1)〜(13)のいずれか1項に記載の情報処理装置。
(15)
入力された音声に応じて設定される特定指示情報に基づき、動画像における1または複数のフレームを抽出すること、
前記抽出されたフレームを特定するフレーム特定情報を記憶部に記録させること、
を含む、情報処理方法。
(16)
コンピュータに、
入力された音声に応じて設定される特定指示情報に基づき、動画像における1または複数のフレームを抽出し、前記抽出されたフレームを特定するフレーム特定情報を記憶部に記録させる処理を実行させるためのプログラム。
(1)
入力された音声に応じて設定される特定指示情報に基づき、動画像における1または複数のフレームを抽出し、前記抽出されたフレームを特定するフレーム特定情報を記憶部に記録させる処理部を備える、情報処理装置。
(2)
前記特定指示情報は、入力された音声を解析して設定される、前記(1)に記載の情報処理装置。
(3)
前記音声は、前記動画像の取得とともに取得された音声である、前記(2)に記載の情報処理装置。
(4)
前記特定指示情報は、予め設定された特定コマンドである、前記(1)〜(3)のいずれか1項に記載の情報処理装置。
(5)
前記特定指示情報には、時間情報が含まれる、前記(1)〜(4)のいずれか1項に記載の情報処理装置。
(6)
前記処理部は、動画像の各フレームと前記特定指示情報との相関を解析する、前記(1)〜(5)のいずれか1項に記載の情報処理装置。
(7)
前記処理部は、前記相関が所定よりも高い場合に、前記1または複数のフレームの抽出を行う、前記(6)に記載の情報処理装置。
(8)
前記処理部は、前記動画像に付加されている付加情報を用いて、前記動画像から前記特定指示情報と相関のある1または複数のフレームを抽出する、前記(6)に記載の情報処理装置。
(9)
前記付加情報は、動画像を取得したときの位置情報、予め登録された顔画像と照合した人物情報、シーン情報のうち少なくともいずれか1つを含む、前記(8)に記載の情報処理装置。
(10)
前記処理部は、前記動画像を機械学習した結果として得られた推測情報に基づき、前記動画像から前記特定指示情報と相関のある1または複数のフレームを抽出する、前記(6)に記載の情報処理装置。
(11)
前記処理部は、前記特定指示情報に基づいて抽出された1または複数のフレームを表示部に表示させる、前記(1)〜(10)のいずれか1項に記載の情報処理装置。
(12)
動画像を取得する撮像部を備える、前記(1)〜(11)のいずれか1項に記載の情報処理装置。
(13)
前記処理部は、前記フレーム特定情報とともに、動画像の各フレームと前記特定指示情報との相関の程度を示す情報も前記記憶部に記録させる、前記(1)〜(12)のいずれか1項に記載の情報処理装置。
(14)
前記処理部は、前記抽出された1または複数のフレームを候補フレームとして表示部に提示させる、前記(1)〜(13)のいずれか1項に記載の情報処理装置。
(15)
入力された音声に応じて設定される特定指示情報に基づき、動画像における1または複数のフレームを抽出すること、
前記抽出されたフレームを特定するフレーム特定情報を記憶部に記録させること、
を含む、情報処理方法。
(16)
コンピュータに、
入力された音声に応じて設定される特定指示情報に基づき、動画像における1または複数のフレームを抽出し、前記抽出されたフレームを特定するフレーム特定情報を記憶部に記録させる処理を実行させるためのプログラム。
Claims (16)
- 入力された音声に応じて設定される特定指示情報に基づき、動画像における1または複数のフレームを抽出し、前記抽出されたフレームを特定するフレーム特定情報を記憶部に記録させる処理部を備える、情報処理装置。
- 前記特定指示情報は、入力された音声を解析して設定される、請求項1に記載の情報処理装置。
- 前記音声は、前記動画像の取得とともに取得された音声である、請求項2に記載の情報処理装置。
- 前記特定指示情報は、予め設定された特定コマンドである、請求項1〜3のいずれか1項に記載の情報処理装置。
- 前記特定指示情報には、時間情報が含まれる、請求項1〜4のいずれか1項に記載の情報処理装置。
- 前記処理部は、動画像の各フレームと前記特定指示情報との相関を解析する、請求項1〜5のいずれか1項に記載の情報処理装置。
- 前記処理部は、前記相関が所定よりも高い場合に、前記1または複数のフレームの抽出を行う、請求項6に記載の情報処理装置。
- 前記処理部は、前記動画像に付加されている付加情報を用いて、前記動画像から前記特定指示情報と相関のある1または複数のフレームを抽出する、請求項6に記載の情報処理装置。
- 前記付加情報は、動画像を取得したときの位置情報、予め登録された顔画像と照合した人物情報、シーン情報のうち少なくともいずれか1つを含む、請求項8に記載の情報処理装置。
- 前記処理部は、前記動画像を機械学習した結果として得られた推測情報に基づき、前記動画像から前記特定指示情報と相関のある1または複数のフレームを抽出する、請求項6に記載の情報処理装置。
- 前記処理部は、前記特定指示情報に基づいて抽出された1または複数のフレームを表示部に表示させる、請求項1〜10のいずれか1項に記載の情報処理装置。
- 動画像を取得する撮像部を備える、請求項1〜11のいずれか1項に記載の情報処理装置。
- 前記処理部は、前記フレーム特定情報とともに、動画像の各フレームと前記特定指示情報との相関の程度を示す情報も前記記憶部に記録させる、請求項1〜12のいずれか1項に記載の情報処理装置。
- 前記処理部は、前記抽出された1または複数のフレームを候補フレームとして表示部に提示させる、請求項1〜13のいずれか1項に記載の情報処理装置。
- 入力された音声に応じて設定される特定指示情報に基づき、動画像における1または複数のフレームを抽出すること、
前記抽出されたフレームを特定するフレーム特定情報を記憶部に記録させること、
を含む、情報処理方法。 - コンピュータに、
入力された音声に応じて設定される特定指示情報に基づき、動画像における1または複数のフレームを抽出し、前記抽出されたフレームを特定するフレーム特定情報を記憶部に記録させる処理を実行させるためのプログラム。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014118607A JP2015233188A (ja) | 2014-06-09 | 2014-06-09 | 情報処理装置、情報処理方法およびプログラム |
EP15729247.5A EP3152896A1 (en) | 2014-06-09 | 2015-06-01 | Information processor, information processing method, and program |
CN201580029545.8A CN106463155A (zh) | 2014-06-09 | 2015-06-01 | 信息处理器、信息处理方法以及程序 |
US15/305,886 US10181337B2 (en) | 2014-06-09 | 2015-06-01 | Information processor, information processing method, and program |
PCT/JP2015/002766 WO2015190061A1 (en) | 2014-06-09 | 2015-06-01 | Information processor, information processing method, and program |
US16/220,606 US10541006B2 (en) | 2014-06-09 | 2018-12-14 | Information processor, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014118607A JP2015233188A (ja) | 2014-06-09 | 2014-06-09 | 情報処理装置、情報処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015233188A JP2015233188A (ja) | 2015-12-24 |
JP2015233188A5 true JP2015233188A5 (ja) | 2017-03-23 |
Family
ID=53398166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014118607A Pending JP2015233188A (ja) | 2014-06-09 | 2014-06-09 | 情報処理装置、情報処理方法およびプログラム |
Country Status (5)
Country | Link |
---|---|
US (2) | US10181337B2 (ja) |
EP (1) | EP3152896A1 (ja) |
JP (1) | JP2015233188A (ja) |
CN (1) | CN106463155A (ja) |
WO (1) | WO2015190061A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6457156B2 (ja) * | 2016-05-31 | 2019-01-23 | 株式会社オプティム | 録画画像共有システム、方法及びプログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6825875B1 (en) * | 1999-01-05 | 2004-11-30 | Interval Research Corporation | Hybrid recording unit including portable video recorder and auxillary device |
US7035091B2 (en) * | 2002-02-28 | 2006-04-25 | Accenture Global Services Gmbh | Wearable computer system and modes of operating the system |
JP2004260304A (ja) * | 2003-02-24 | 2004-09-16 | Fuji Photo Film Co Ltd | 画像管理システム |
JP2004287063A (ja) * | 2003-03-20 | 2004-10-14 | Miyota Kk | ヘッドマウントディスプレイ |
US8207936B2 (en) * | 2006-06-30 | 2012-06-26 | Sony Ericsson Mobile Communications Ab | Voice remote control |
US9105298B2 (en) * | 2008-01-03 | 2015-08-11 | International Business Machines Corporation | Digital life recorder with selective playback of digital video |
US9159151B2 (en) * | 2009-07-13 | 2015-10-13 | Microsoft Technology Licensing, Llc | Bringing a visual representation to life via learned input from the user |
JP2012175468A (ja) * | 2011-02-22 | 2012-09-10 | Sony Corp | 情報処理装置、情報処理方法、及びプログラム |
WO2013106013A1 (en) * | 2011-03-31 | 2013-07-18 | Noah Spitzer-Williams | Bookmarking moments in a recorded video using a recorded human action |
US8643746B2 (en) * | 2011-05-18 | 2014-02-04 | Intellectual Ventures Fund 83 Llc | Video summary including a particular person |
US9285592B2 (en) | 2011-08-18 | 2016-03-15 | Google Inc. | Wearable device with input and output structures |
US9223136B1 (en) * | 2013-02-04 | 2015-12-29 | Google Inc. | Preparation of image capture device in response to pre-image-capture signal |
US20140247368A1 (en) * | 2013-03-04 | 2014-09-04 | Colby Labs, Llc | Ready click camera control |
KR20150129143A (ko) * | 2014-05-08 | 2015-11-19 | 삼성디스플레이 주식회사 | 벽면 디스플레이 시스템 |
-
2014
- 2014-06-09 JP JP2014118607A patent/JP2015233188A/ja active Pending
-
2015
- 2015-06-01 EP EP15729247.5A patent/EP3152896A1/en not_active Withdrawn
- 2015-06-01 US US15/305,886 patent/US10181337B2/en active Active
- 2015-06-01 WO PCT/JP2015/002766 patent/WO2015190061A1/en active Application Filing
- 2015-06-01 CN CN201580029545.8A patent/CN106463155A/zh active Pending
-
2018
- 2018-12-14 US US16/220,606 patent/US10541006B2/en not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4896838B2 (ja) | 撮像装置、画像検出装置及びプログラム | |
WO2019047789A1 (zh) | 关于增强现实场景的处理方法、终端设备、系统及计算机存储介质 | |
JP2018519007A5 (ja) | ||
US9955134B2 (en) | System and methods for simultaneously capturing audio and image data for digital playback | |
WO2016187985A1 (zh) | 拍摄设备、跟踪拍摄方法和系统、以及计算机存储介质 | |
RU2018103060A (ru) | Способы и системы для извлечения характеристик движения пользователя с использованием датчика холла для предоставления пользователю обратной связи | |
KR101508092B1 (ko) | 화상 회의를 지원하는 방법 및 시스템 | |
WO2019213818A1 (zh) | 拍摄控制方法及电子装置 | |
JP2012151705A5 (ja) | ||
US20210105437A1 (en) | Information processing device, information processing method, and storage medium | |
TW201513095A (zh) | 語音處理系統、裝置及方法 | |
JP6640460B2 (ja) | 画像撮影装置、画像撮影方法、プログラムおよび記録媒体 | |
KR20140089771A (ko) | 오디오 데이터를 가지는 이미지를 촬영하기 위한 장치 및 방법 | |
CN111586490A (zh) | 一种多媒体互动方法、装置、设备及存储介质 | |
WO2020052062A1 (zh) | 检测方法和装置 | |
US11163822B2 (en) | Emotional experience metadata on recorded images | |
JP2018093312A5 (ja) | ||
JP2024059809A (ja) | 情報処理装置、情報処理方法、情報処理システム及び情報処理プログラム | |
JP2012151544A (ja) | 撮像装置及びプログラム | |
CN115552913A (zh) | 信息处理方法、信息处理装置、程序及信息处理系统 | |
JP2017028585A5 (ja) | 撮影システム及びその制御方法、制御装置、コンピュータプログラム | |
JP2015233188A5 (ja) | ||
JP6693710B2 (ja) | 映像解析装置及び映像解析方法 | |
JP2016506688A (ja) | シングルクリックに基づく映像クリップの始点および終点の判定方法 | |
KR101483434B1 (ko) | 강의 영상 녹화 시스템 |