JP6219808B2 - 映像検索装置の動作方法、映像検索方法および映像検索装置 - Google Patents
映像検索装置の動作方法、映像検索方法および映像検索装置 Download PDFInfo
- Publication number
- JP6219808B2 JP6219808B2 JP2014244721A JP2014244721A JP6219808B2 JP 6219808 B2 JP6219808 B2 JP 6219808B2 JP 2014244721 A JP2014244721 A JP 2014244721A JP 2014244721 A JP2014244721 A JP 2014244721A JP 6219808 B2 JP6219808 B2 JP 6219808B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- video
- subject
- frame
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
被写体の動きやカメラワークを含む映像では、画面中に様々な被写体が何度も移り変わり出現する可能性がある。例えば映画であれば主演の俳優は多くのシーンで登場すると考えられ、またF1(レース)の実況番組では同じ車両がコースの各撮影地点、各周回で撮影され、画面中に登場する機会がある。
映像検索装置1は、入力部2から情報を入力し、表示部3に映像を出力(表示)するものである。
映像検索装置1は、映像情報記憶部11、被写体情報生成部12、被写体情報記憶部13、インスタンス操作部14、検索プログラム生成部15、検索部16、映像情報取得部17を備える。
入力部2と表示部3は、PCやテレビ、タブレットといった入出力装置を備えた端末、あるいはユーザの入力を受け付けるモジュールと映像のファイルやストリーミングデータを再生可能なモジュールを備えるウェブブラウザなどのソフトウェアであると想定する。
被写体情報について、図2(a)のように、円卓の上にリンゴ、バナナ、ブドウの3つが置かれている風景を撮影したケースを例に説明する。
図3(a)、(b)、(c)はそれぞれ、リンゴ、バナナ、ブドウを被写体とした場合の被写体情報を表したものである。各被写体について、映像フレーム数と対応する被写体の座標(被写体領域の重心座標や、被写体領域を囲む矩形の座標など)と、被写体の大きさ(被写体領域の面積など)が表示されている。このとき空欄は被写体が画面上に表示されていないフレームであることを示している。この被写体情報より、例えばリンゴは26frameで画面左にフレームアウトし、バナナは22frameで画面左上から出現していることなどが読み取れる。
まず、ステップS1で、表示部3は映像領域、検索領域、検索周辺領域、検索カードを表示する。
上部の映像領域31には、ユーザによる検索の結果として取得された映像が再生される。
中段に示す検索領域32の周辺に検索周辺領域33が構成される。
ステップS215では、方向スコアを計算し、ステップS216に進む。
以降、特に言及がない限り図上で映像領域31は省略している。
{“object”: “Banana”, “from”: “right”}
バナナの検索カード4をつかみ、ブドウの検索カード4に重ねることで、一枚の中にバナナとブドウの二つが描かれた検索カード4が生成される。このとき、検索カード4を重ねる順番などで映像中の対応するオブジェクトの奥行きや出現する順序などを表してもよい。新しく生成された検索カード4を、図8と同様に検索領域32に右側から入れた場合、バナナとブドウが同時に右側から出現する映像を検索することを表す。このときの操作情報は例えば下記のように表される。
{“object”: [“Banana”, “Grape”], “from”: “right” }
図のように、新しく生成された検索カード4に含まれるオブジェクトについて、検索カード4の中で位置を変更することで、二つのオブジェクトの位置関係を指定してもよい。図ではブドウをバナナの左側に移動しているため、「ブドウとバナナが同時に出現するが、ブドウはバナナから左に離れたところに存在している映像」を指定することになる。図のように検索カード4内でオブジェクトの位置を変更し、新しく生成された検索カード4を検索領域に右側から入れた場合の操作情報は例えば下記のように表される。
{“object”: [“Banana”, “Grape”], “innerPosition”: [{“x”: 200, “y”: 50}, {“x”: 50, “y”: 100}], “from”: “right” }
その後、図8のように検索カードを操作した場合、操作情報は例えば下記のように表される。
{“object”: “Apple”, “condition”: “bitten”, “from”: “right”}
{“object”: “Sun”, “color”: {“R”: 220, “G”: 70, “B”: 30}, “from”: “right”}
検索カード4のうち類似したものを集めてグループ化しておくことで、上位概念での検索を可能とする。例えば上位概念としてフルーツを設定してその検索カード4を用いることで、リンゴ、バナナ、ブドウが出現する映像を横断的に検索することができる。例えば、ボタン131をクリックすると、リンゴ、バナナ、ブドウの検索カード4が、フルーツ、人、家具の検索カード4に切り替わる。
{“object”: “Banana”, “move”: [{“x”: 500, “y”: 200},{“x”: 150, “y”: 200}] }
{“object”: “Banana”, “size”: [100, 50]}
{“object”: “Banana”, “rotate”, 80, “from”: “right”}
{“object”: “Sun”, “color”: [{“R”: 255, “G”: 255, “B”: 255}, {“R”: 220, “G”: 70, “B”: 30}]}
{“object”: “Banana”, “to”: “left”}
{“object”: [“Banana”, “Grape”], “to”: “left”, “only”: “Banana”}
{“search_id”: 0, “object”: “Apple”, “from”: “bottom”}
{“search_id”: 1, “object”: “Banana”, “from”: “bottom”, “after”: 0}
{“search_id”: 2, “object”: “Apple”, “from”: “bottom”, “lock”: true}
{“search_id”: 3, “object”: “Banana”, “from”: “bottom”, “after”: 2}
{“search_id”: 4, “object”: “Apple”, “move”: {“x”: 50, “y”: 100}, “lock”: true}
{“search_id”: 5, “object”: “Banana”, “move”: [{“x”: 500, “y”: 300}, {“x”: 100, “y”: 150}], “after”: 4}
{ “search_id”: 6, “object”: “Apple”, “lock”: true }
{“search_id”: 7, “object”: “Banana”, “after”: 6, “wait”: 5.0}
{“object”: “Apple”, “from”: “left”}
特にこの例ではF1レースの映像を想定しており、検索領域32にサーキットコース図、検索カード4に出場選手の名前と所属国旗を利用している。
図32は、検索領域自体を検索カードとして用いる様子を示す図である。
図のように、検索領域32や映像領域31を検索カード4として利用してもよい。例えばある検索領域32に対する操作で「画面中央付近にバナナが映っているシーン」が検索結果として得られたとする。その検索領域32を検索カード4として指定し、もう一つの検索領域32に左側から挿入した場合、「「画面中央付近にバナナが映っているシーン」が画面左側から登場したシーン」が検索結果として得られると想定される。これはワイプ、スライドイン、プッシュなどのシーン切り替えを利用した複数の映像のつなぎや、映像中に別の映像を含むPinPのような映像表現に対して有効だと考えられる。
2 入力部
3 表示部
4 検索カード
11 映像情報記憶部
12 被写体情報生成部
13 被写体情報記憶部
14 インスタンス操作部
15 検索プログラム生成部
16 検索部
17 映像情報取得部
Claims (8)
- 映像検索装置の動作方法であって、
前記映像検索装置は、映像のフレームごとに当該フレームのフレーム番号と当該フレーム内の被写体の位置情報が記憶される被写体情報記憶部を備え、
前記動作方法は、
前記映像検索装置が、前記映像に映る被写体と当該被写体の状態を表す操作対象を予め設けられた検索領域に移動させる操作に基づいて当該操作対象がどのように移動したかを表す操作情報を生成し、
前記映像検索装置が、前記操作情報に基づいて当該操作対象のように移動する当該状態の当該被写体が映るフレームのフレーム番号を前記被写体情報記憶部から検索するための検索プログラムを生成し、
前記映像検索装置が、前記被写体情報記憶部から前記検索プログラムによりフレーム番号を検索する
ことを特徴とする映像検索装置の動作方法。 - 前記操作対象は、前記映像に映る複数の被写体と当該各被写体の状態を表し、
前記動作方法は、当該状態の当該複数の被写体が映るフレームのフレーム番号を検索する
ことを特徴とする請求項1記載の映像検索装置の動作方法。 - 複数の前記操作対象が順に操作された場合、当該操作の順および当該操作対象に対応する被写体が映るフレームのフレーム番号を検索する
ことを特徴とする請求項1または2記載の映像検索装置の動作方法。 - 前記検索領域の周辺に検索周辺領域が設けられ、
前記操作対象が前記検索周辺領域に移動して待機の後、前記検索領域に移動した場合、当該操作対象の直前に操作された操作対象に対応する被写体が映像に映ってから前記待機の時間に応じた時間が経過した後に前記検索周辺領域に待機した操作対象に対応する被写体が映像に映るフレームのフレーム番号を検索する
ことを特徴とする請求項3記載の映像検索装置の動作方法。 - 前記検索領域が設けられる装置と前記操作対象が設けられる装置が異なる
ことを特徴とする請求項1ないし3のいずれかに記載の映像検索装置の動作方法。 - 前記検索領域に移動後、前記操作対象が操作された場合、当該操作対象が検索領域でどのように操作されたかを表す操作情報を生成する
ことを特徴とする請求項1ないし5のいずれかに記載の映像検索装置の動作方法。 - 映像に映る被写体と当該被写体の状態を表す操作対象を予め設けられた検索領域に移動させる操作が行われたことを契機に、当該操作対象のように移動する当該状態の当該被写体が映るフレームから構成される映像を所定の表示部に表示させる
ことを特徴とする映像検索方法。 - 映像のフレームごとに当該フレームのフレーム番号と当該フレーム内の被写体の位置情報が記憶される被写体情報記憶部と、
前記映像に映る被写体と当該被写体の状態を表す操作対象を予め設けられた検索領域に移動させる操作に基づいて当該操作対象がどのように移動したかを表す操作情報を生成するインスタンス操作部と、
前記操作情報に基づいて当該操作対象のように移動する当該状態の当該被写体が映るフレームのフレーム番号を前記被写体情報記憶部から検索するための検索プログラムを生成する検索プログラム生成部と、
前記被写体情報記憶部から前記検索プログラムによりフレーム番号を検索する検索部と
を備えることを特徴とする映像検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014244721A JP6219808B2 (ja) | 2014-12-03 | 2014-12-03 | 映像検索装置の動作方法、映像検索方法および映像検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014244721A JP6219808B2 (ja) | 2014-12-03 | 2014-12-03 | 映像検索装置の動作方法、映像検索方法および映像検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016110252A JP2016110252A (ja) | 2016-06-20 |
JP6219808B2 true JP6219808B2 (ja) | 2017-10-25 |
Family
ID=56122274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014244721A Active JP6219808B2 (ja) | 2014-12-03 | 2014-12-03 | 映像検索装置の動作方法、映像検索方法および映像検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6219808B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06101018B2 (ja) * | 1991-08-29 | 1994-12-12 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 動画像データベースの検索 |
JP4572545B2 (ja) * | 2004-02-17 | 2010-11-04 | 富士ゼロックス株式会社 | 情報処理システム及び情報処理方法、並びにコンピュータ・プログラム |
US8688675B2 (en) * | 2006-02-27 | 2014-04-01 | Robert Bosch Gmbh | Trajectory-based video retrieval system, and computer program |
JP5912810B2 (ja) * | 2012-04-25 | 2016-04-27 | シャープ株式会社 | 表示システムおよび表示プログラム |
-
2014
- 2014-12-03 JP JP2014244721A patent/JP6219808B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016110252A (ja) | 2016-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Su et al. | Pano2vid: Automatic cinematography for watching 360 videos | |
US10769438B2 (en) | Augmented reality | |
JP5355422B2 (ja) | ビデオの索引付けとビデオシノプシスのための、方法およびシステム | |
US9966112B1 (en) | Systems and methods to associate multimedia tags with user comments and generate user modifiable snippets around a tag time for efficient storage and sharing of tagged items | |
Schoeffmann et al. | Video interaction tools: A survey of recent work | |
Adcock et al. | Talkminer: a lecture webcast search engine | |
KR102290419B1 (ko) | 디지털 컨텐츠의 시각적 내용 분석을 통해 포토 스토리를 생성하는 방법 및 장치 | |
US20190289359A1 (en) | Intelligent video interaction method | |
CN105474207B (zh) | 用于搜索多媒体内容的用户界面方法和设备 | |
US20140328570A1 (en) | Identifying, describing, and sharing salient events in images and videos | |
Tiwari et al. | A survey of recent work on video summarization: approaches and techniques | |
US11630862B2 (en) | Multimedia focalization | |
CN109408672B (zh) | 一种文章生成方法、装置、服务器及存储介质 | |
CN113992973B (zh) | 视频摘要生成方法、装置、电子设备和存储介质 | |
Husa et al. | HOST-ATS: automatic thumbnail selection with dashboard-controlled ML pipeline and dynamic user survey | |
KR20140041561A (ko) | 객체 위치를 통한 비디오 내비게이션 | |
Rossetto et al. | Searching in video collections using sketches and sample images–the Cineast system | |
WO1999005865A1 (en) | Content-based video access | |
JP6219808B2 (ja) | 映像検索装置の動作方法、映像検索方法および映像検索装置 | |
Collyda et al. | Videoanalysis4all: An on-line tool for the automatic fragmentation and concept-based annotation, and the interactive exploration of videos | |
Niu et al. | Real-time generation of personalized home video summaries on mobile devices | |
Patel | Content based video retrieval: a survey | |
Apostolidis et al. | Video fragmentation and reverse search on the web | |
Zhang et al. | VSSum: A Virtual Surveillance Dataset for Video Summary | |
KR102431180B1 (ko) | 관계 정보 기반의 성장형 콘텐츠 서비스 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170914 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170926 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170928 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6219808 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |