JP5278425B2 - 映像分割装置、方法及びプログラム - Google Patents
映像分割装置、方法及びプログラム Download PDFInfo
- Publication number
- JP5278425B2 JP5278425B2 JP2010502811A JP2010502811A JP5278425B2 JP 5278425 B2 JP5278425 B2 JP 5278425B2 JP 2010502811 A JP2010502811 A JP 2010502811A JP 2010502811 A JP2010502811 A JP 2010502811A JP 5278425 B2 JP5278425 B2 JP 5278425B2
- Authority
- JP
- Japan
- Prior art keywords
- subject
- video
- word
- text
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
Description
本発明は、日本国特許出願:特願2008−066221号(2008年3月14日出願)の優先権主張に基づくものであり、同出願の全記載内容は引用をもって本書に組み込み記載されているものとする。
12 テキスト記憶部
13 被写体判定部
14 被写体重み付け部
15 重み付きテキスト記憶部
16 映像分割部
17 分割結果記憶部
18 映像視聴部
31 映像分割用プログラム
32 データ処理装置
33 記憶装置
130 被写体認識部
131 オブジェクト認識部
132 顔画像認識部
133 文字認識部
134 被写体抽出部
135 被写体認識結果記憶部
136 照合部
331 映像データ記憶部
332 テキスト記憶部
333 重み付きテキスト記憶部
334 分割結果記憶部
335 被写体認識結果記憶部
Claims (31)
- 映像と関連付けられたテキストであって該映像における再生位置が付されたものを参照して該テキストに含まれる単語又は単語列(以下「単語等」という。)が該映像に含まれる被写体を表すか否かを判定する被写体判定部と、
前記単語等のうち前記被写体を表すと判定されたものに対してそれ以外のものに対する重み付けよりも大きい重み付けをする被写体重み付け部と、
前記重み付けに基づいて前記テキストを分割することによって前記映像を分割する映像分割部と、を備えていることを特徴とする映像分割装置。 - 前記被写体判定部は、前記単語等が前記映像のうち前記再生位置を基準とする所定の範囲内のものに映っている被写体を表すか否かの判定をすることを特徴とする、請求項1に記載の映像分割装置。
- 前記被写体判定部は、前記単語等が前記映像に映っている被写体を表すと判定した場合には前記単語等が該被写体を表す信頼度を計算するとともに、
前記被写体重み付け部は、前記信頼度が高いものほど前記単語等に大きい重み付けをすることを特徴とする、請求項1に記載の映像分割装置。 - 前記被写体判定部は、前記単語等が前記映像に映っている被写体を表すと判定した場合には該被写体の前記映像における重要度を決定するとともに、
前記被写体重み付け部は、前記重要度が高いものほど前記単語等に大きい重み付けをすることを特徴とする、請求項1に記載の映像分割装置。 - 前記被写体判定部は、前記被写体が前記映像に占める割合に応じて前記被写体の重要度を決定することを特徴とする、請求項4に記載の映像分割装置。
- 前記被写体判定部は、前記映像に映っている被写体を認識して被写体認識結果テキストとして出力する被写体認識部と、
前記単語等と前記被写体認識結果テキストとを照合して前記単語等が前記映像に映っている被写体を表すか否かを判定する照合部と、をさらに備えていることを特徴とする、請求項1に記載の映像分割装置。 - 前記被写体は、オブジェクト、顔画像、又は文字を含むことを特徴とする、請求項6に記載の映像分割装置。
- 前記被写体認識部は、前記オブジェクトを認識するオブジェクト認識部、前記顔画像を認識する顔画像認識部、前記文字を認識する文字認識部、及び、前記テキストに含まれる単語等から被写体を表す単語等を抽出する被写体抽出部、のうち少なくとも1つを備えていることを特徴とする、請求項7に記載の映像分割装置。
- 前記照合部は、前記単語等及び前記被写体認識結果テキストのうち少なくとも一方をシソーラスによって展開して、前記単語等と前記被写体認識結果テキストとを照合することを特徴とする、請求項6に記載の映像分割装置。
- 前記テキストは、前記映像に含まれる発話の内容を表すテキストであることを特徴とする、請求項1乃至9のいずれか1項に記載の映像分割装置。
- 前記再生位置は、前記テキストに含まれる文又は単語等を単位として付与されていることを特徴とする、請求項1乃至10のいずれか1項に記載の映像分割装置。
- コンピュータによって、
映像と関連付けられたテキストであって該映像における再生位置が付されたものを参照して該テキストに含まれる単語又は単語列(以下「単語等」という。)が該映像に含まれる被写体を表すか否かを判定する被写体判定工程と、
前記単語等のうち前記被写体を表すと判定されたものに対してそれ以外のものに対する重み付けよりも大きい重み付けをする被写体重み付け工程と、
前記重み付けに基づいて前記テキストを分割することによって前記映像を分割する映像分割工程と、を含むことを特徴とする映像分割方法。 - 前記被写体判定工程において、前記単語等が前記映像のうち前記再生位置を基準とする所定の範囲内のものに映っている被写体を表すか否かの判定をすることを特徴とする、請求項12に記載の映像分割方法。
- 前記被写体判定工程において、前記単語等が前記映像に映っている被写体を表すと判定した場合には前記単語等が該被写体を表す信頼度を計算し、
前記被写体重み付け工程において、前記信頼度が高いものほど前記単語等に大きい重み付けをすることを特徴とする、請求項12に記載の映像分割方法。 - 前記被写体判定工程において、前記単語等が前記映像に映っている被写体を表すと判定した場合には該被写体の前記映像における重要度を決定し、
前記被写体重み付け工程において、前記重要度が高いものほど前記単語等に大きい重み付けをすることを特徴とする、請求項12に記載の映像分割方法。 - 前記被写体判定工程において、前記被写体が前記映像に占める割合に応じて前記被写体の重要度を決定することを特徴とする、請求項15に記載の映像分割方法。
- 前記被写体判定工程は、前記映像に映っている被写体を認識して被写体認識結果テキストとして出力する被写体認識工程と、
前記単語等と前記被写体認識結果テキストとを照合して前記単語等が前記映像に映っている被写体を表すか否かを判定する照合工程と、を含むことを特徴とする、請求項12に記載の映像分割方法。 - 前記被写体は、オブジェクト、顔画像、又は文字を含むことを特徴とする、請求項17に記載の映像分割方法。
- 前記被写体認識工程は、前記オブジェクトを認識するオブジェクト認識工程、前記顔画像を認識する顔画像認識工程、前記文字を認識する文字認識工程、及び、前記テキストに含まれる単語等から被写体を表す単語等を抽出する被写体抽出工程、のうち少なくとも1つを含むことを特徴とする、請求項18に記載の映像分割方法。
- 前記照合工程において、前記単語等及び前記被写体認識結果テキストのうち少なくとも一方をシソーラスによって展開して、前記単語等と前記被写体認識結果テキストとを照合することを特徴とする、請求項17に記載の映像分割方法。
- 前記テキストは、前記映像に含まれる発話の内容を表すテキストであることを特徴とする、請求項12乃至20のいずれか1項に記載の映像分割方法。
- 映像と関連付けられたテキストであって該映像における再生位置が付されたものを参照して該テキストに含まれる単語又は単語列(以下「単語等」という。)が該映像に含まれる被写体を表すか否かを判定する被写体判定処理と、
前記単語等のうち前記被写体を表すと判定されたものに対してそれ以外のものに対する重み付けよりも大きい重み付けをする被写体重み付け処理と、
前記重み付けに基づいて前記テキストを分割することによって前記映像を分割する映像分割処理と、をコンピュータに実行させることを特徴とするプログラム。 - 前記被写体判定処理において、前記単語等が前記映像のうち前記再生位置を基準とする所定の範囲内のものに映っている被写体を表すか否かの判定をすることを特徴とする、請求項22に記載のプログラム。
- 前記被写体判定処理において、前記単語等が前記映像に映っている被写体を表すと判定した場合には前記単語等が該被写体を表す信頼度を計算し、
前記被写体重み付け処理において、前記信頼度が高いものほど前記単語等に大きい重み付けをすることを特徴とする、請求項22に記載のプログラム。 - 前記被写体判定処理において、前記単語等が前記映像に映っている被写体を表すと判定した場合には該被写体の前記映像における重要度を決定し、
前記被写体重み付け処理において、前記重要度が高いものほど前記単語等に大きい重み付けをすることを特徴とする、請求項22に記載のプログラム。 - 前記被写体判定処理において、前記被写体が前記映像に占める割合に応じて前記被写体の重要度を決定することを特徴とする、請求項25に記載のプログラム。
- 前記被写体判定処理において、前記映像に映っている被写体を認識して被写体認識結果テキストとして出力する被写体認識処理と、
前記単語等と前記被写体認識結果テキストとを照合して前記単語等が前記映像に映っている被写体を表すか否かを判定する照合処理と、をコンピュータに実行させることを特徴とする、請求項22に記載のプログラム。 - 前記被写体は、オブジェクト、顔画像、又は文字を含むことを特徴とする、請求項27に記載のプログラム。
- 前記被写体認識処理において、前記オブジェクトを認識するオブジェクト認識処理、前記顔画像を認識する顔画像認識処理、前記文字を認識する文字認識処理、及び、前記テキストに含まれる単語等から被写体を表す単語等を抽出する被写体抽出処理、のうち少なくとも1つをコンピュータに実行させることを特徴とする、請求項28に記載のプログラム。
- 前記照合処理において、前記単語等及び前記被写体認識結果テキストのうち少なくとも一方をシソーラスによって展開して、前記単語等と前記被写体認識結果テキストとを照合することを特徴とする、請求項27に記載のプログラム。
- 前記テキストは、前記映像に含まれる発話の内容を表すテキストであることを特徴とする、請求項22乃至30のいずれか1項に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010502811A JP5278425B2 (ja) | 2008-03-14 | 2009-03-09 | 映像分割装置、方法及びプログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008066221 | 2008-03-14 | ||
JP2008066221 | 2008-03-14 | ||
JP2010502811A JP5278425B2 (ja) | 2008-03-14 | 2009-03-09 | 映像分割装置、方法及びプログラム |
PCT/JP2009/054467 WO2009113505A1 (ja) | 2008-03-14 | 2009-03-09 | 映像分割装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009113505A1 JPWO2009113505A1 (ja) | 2011-07-21 |
JP5278425B2 true JP5278425B2 (ja) | 2013-09-04 |
Family
ID=41065172
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010502811A Active JP5278425B2 (ja) | 2008-03-14 | 2009-03-09 | 映像分割装置、方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5278425B2 (ja) |
WO (1) | WO2009113505A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10878657B2 (en) | 2018-07-25 | 2020-12-29 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
US11521460B2 (en) | 2018-07-25 | 2022-12-06 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6369399B2 (ja) * | 2015-06-26 | 2018-08-08 | 株式会社デンソー | センサ出力補正装置 |
CN105426515B (zh) * | 2015-12-01 | 2018-12-18 | 小米科技有限责任公司 | 视频归类方法及装置 |
KR102024933B1 (ko) * | 2017-01-26 | 2019-09-24 | 한국전자통신연구원 | 동적 생성된 메타데이터를 이용한 영상 콘텐츠 콘텍스트 변이 추적 장치 및 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005236546A (ja) * | 2004-02-18 | 2005-09-02 | Nippon Telegr & Teleph Corp <Ntt> | 部分コンテンツ作成方法及び装置及びプログラム |
JP2007241902A (ja) * | 2006-03-10 | 2007-09-20 | Univ Of Tsukuba | テキストデータの分割システム及びテキストデータの分割及び階層化方法 |
JP2007293602A (ja) * | 2006-04-25 | 2007-11-08 | Nec Corp | 映像検索システム、映像検索方法およびプログラム |
-
2009
- 2009-03-09 JP JP2010502811A patent/JP5278425B2/ja active Active
- 2009-03-09 WO PCT/JP2009/054467 patent/WO2009113505A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005236546A (ja) * | 2004-02-18 | 2005-09-02 | Nippon Telegr & Teleph Corp <Ntt> | 部分コンテンツ作成方法及び装置及びプログラム |
JP2007241902A (ja) * | 2006-03-10 | 2007-09-20 | Univ Of Tsukuba | テキストデータの分割システム及びテキストデータの分割及び階層化方法 |
JP2007293602A (ja) * | 2006-04-25 | 2007-11-08 | Nec Corp | 映像検索システム、映像検索方法およびプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10878657B2 (en) | 2018-07-25 | 2020-12-29 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
US11455864B2 (en) | 2018-07-25 | 2022-09-27 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
US11521460B2 (en) | 2018-07-25 | 2022-12-06 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
Also Published As
Publication number | Publication date |
---|---|
WO2009113505A1 (ja) | 2009-09-17 |
JPWO2009113505A1 (ja) | 2011-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110309305B (zh) | 基于多任务联合训练的机器阅读理解方法及计算机存储介质 | |
US7949531B2 (en) | Conversation controller | |
JP5257071B2 (ja) | 類似度計算装置及び情報検索装置 | |
US7949532B2 (en) | Conversation controller | |
Pavel et al. | Sceneskim: Searching and browsing movies using synchronized captions, scripts and plot summaries | |
US7949530B2 (en) | Conversation controller | |
US8126713B2 (en) | Conversation control system and conversation control method | |
KR100828166B1 (ko) | 동영상의 음성 인식과 자막 인식을 통한 메타데이터 추출방법, 메타데이터를 이용한 동영상 탐색 방법 및 이를기록한 기록매체 | |
US20180107636A1 (en) | Method and apparatus for establishing sentence editing model, sentence editing method and apparatus | |
Ma et al. | Learning to generate grounded visual captions without localization supervision | |
JP5278425B2 (ja) | 映像分割装置、方法及びプログラム | |
AU2003236049B2 (en) | Conversation control system and conversation control method | |
Hassani et al. | LVTIA: A new method for keyphrase extraction from scientific video lectures | |
Bigot et al. | Person name recognition in ASR outputs using continuous context models | |
AlMousa et al. | Nlp-enriched automatic video segmentation | |
US7949667B2 (en) | Information processing apparatus, method, and program | |
WO2012134396A1 (en) | A method, an apparatus and a computer-readable medium for indexing a document for document retrieval | |
Ohtsuki et al. | Automatic multimedia indexing: combining audio, speech, and visual information to index broadcast news | |
JP2009140411A (ja) | 文章要約装置および文章要約方法 | |
JP4175093B2 (ja) | トピック境界決定方法及び装置及びトピック境界決定プログラム | |
Gonsalves et al. | ML-Based Indexing of Media Libraries for Insights and Search | |
CN115022733B (zh) | 摘要视频生成方法、装置、计算机设备及存储介质 | |
CN112084777B (zh) | 一种实体链接方法 | |
Shi et al. | Socio-situational setting classification based on language use | |
JP7258627B2 (ja) | 採点支援装置、その方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130423 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130506 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5278425 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |