JP4346613B2 - 映像要約装置及び映像要約方法 - Google Patents
映像要約装置及び映像要約方法 Download PDFInfo
- Publication number
- JP4346613B2 JP4346613B2 JP2006003973A JP2006003973A JP4346613B2 JP 4346613 B2 JP4346613 B2 JP 4346613B2 JP 2006003973 A JP2006003973 A JP 2006003973A JP 2006003973 A JP2006003973 A JP 2006003973A JP 4346613 B2 JP4346613 B2 JP 4346613B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- section
- audio
- video data
- attribute information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
Description
図1は、本発明の第1の実施形態に係る映像要約装置の構成例を示すブロック図である。
次に、イベントごとの重要度曲線から、次式に従い、図17(c)に示すように、映像コンテンツ全体の重要度曲線ER(t)を算出する。ただし、Max(Ei(t))は時刻tにおけるEi(t)の最大値を示す。
ER(t)=Max(Ei(t))
最後に、太線で示された区間1203のようにコンテンツ全体の重要度曲線ER(t)が閾値ERthより大きい区間を抽出し、要約映像とする。なお、閾値ERthは、その値が小さい(低い)ほど、要約映像区間は長くなり、大きい(高い)ほど要約映像区間は短くなる。そこで、閾値ERthは抽出された区間の合計時間が要約作成条件に含まれる全体の再生時間を満足するように決定される。
図2のステップS05では、映像データに含まれる音声の無音区間あるいは音の小さい区間を検出することによって、区切り位置を検出したが、区切り位置を検出する方法はこの手法に限らない。
正規化係数とは閾値を上回る確率値に乗ずることにより、その合計を「1」にすることができる係数である。音声の特徴ベクトルがいずれかのコードブックの正規分布に近づくにつれて、確率値が大きくなる。すなわち、正規化係数が小さくなる。正規化係数が最も小さいコードブックを選択することにより、話者の判別が可能であり、話者の交代も検出することができる。
図2のステップS06では、要約映像データに含まれる各映像区間の説明音声として用いる音声区間を、各映像区間の属性情報に記述された事象の発生時刻と音声区間の時間的位置との関係に従って決定したが、音声区間を選択する方法はこの限りではない。
図9、図10、図11を参照して、第2の実施形態について説明する。図9は第2の実施形態に係る映像要約装置の構成例を示すブロック図である。なお、図9において、図1と同一部分には同一符号を付し、異なる部分についてのみ説明する。すなわち、図9では、図1の映像区間制御部109に代えて、要約映像データの音量を調整する音量制御部700を備えている。
図12、図13、図14を参照して第3の実施形態について説明する。図12は第3の実施形態に係る映像要約装置の構成例を示すブロック図である。なお、図12において、図1と同一部分には同一符号を付し、異なる部分についてのみ説明する。すなわち、図12では、図1の映像区間制御部109に代えて、要約映像データ中の映像区間の説明音声として抽出された音声区間の時間位置をずらす音声区間制御部900を備えている。
なお、図12では、図1の映像区間制御部109に代えて、要約映像データの音量を調整する音量制御部700を備えている場合を示しているが、図15に示すように、図12に、第2の実施形態で説明した音量制御部700や、第1の実施形態で説明した映像区間制御部109をさらに追加した構成もあり得る。この場合、要約映像データ中の各映像区間と、当該映像区間に対し説明音声として抽出された音声区間の長さ及び時間的位置関係を基に、要約映像データ中の各映像区間に対し、映像区間制御部109と、音量制御部700と、音声区間制御部900のいずれか1つを選択するための切替部1000が追加されている。図15の映像要約装置の処理動作を図16に示す。なお、図16では、要約映像データ中の各映像区間に対し、切替部1000により、映像区間制御部109と、音量制御部700と、音声区間制御部900のいずれかが選択されて、映像区間の修正、音量の制御、音声区間の制御が行われる点が、図2、図11、図14と異なる。
Claims (14)
- 映像及び音声を含む時系列的な映像データを記憶する映像記憶手段と、
前記映像データ中の複数の映像区間のそれぞれについて、当該映像区間内の映像の内容を示した属性情報を記憶する属性情報記憶手段と、
前記属性情報記憶手段から、指定されたキーワードを含む属性情報を選択する選択手段と、
前記映像記憶手段に記憶されている映像データのうち、前記選択手段で選択された属性情報に対応する映像区間の映像データを時系列に接続することにより、要約映像データを生成する要約映像生成手段と、
前記映像記憶手段に記憶されている前記映像データに含まれる音声の区切り位置を検出する検出手段と、
前記検出手段で検出された区切り位置で区切られた音声区間のなかから、前記要約映像データ中の各映像区間に対し、当該映像区間の説明音声として用いる音声区間を抽出する抽出手段と、
前記要約映像データ中の映像区間の終了時点が、当該映像区間に対し前記抽出手段で抽出された音声区間の終了時点と一致あるいは以後となるように、当該映像区間の終了時点を修正する修正手段と、
前記修正手段で修正された映像区間を含む前記要約映像データ中の各映像区間の前記説明音声の音量を、当該映像区間内の当該説明音声以外の音声よりも大きく設定する音量制御手段と、
を具備したことを特徴とする映像要約装置。 - 映像及び音声を含む時系列的な映像データを記憶する映像記憶手段と、
前記映像データ中の複数の映像区間のそれぞれについて、当該映像区間内の映像の内容を示した属性情報を記憶する属性情報記憶手段と、
前記属性情報記憶手段から、指定されたキーワードを含む属性情報を選択する選択手段と、
前記映像記憶手段に記憶されている映像データのうち、前記選択手段で選択された属性情報に対応する映像区間の映像データを時系列に接続することにより、要約映像データを生成する要約映像生成手段と、
前記映像記憶手段に記憶されている前記映像データに含まれる音声の区切り位置を検出する検出手段と、
前記検出手段で検出された区切り位置で区切られた音声区間のなかから、前記要約映像データ中の各映像区間に対し、当該映像区間の説明音声として用いる音声区間を抽出する抽出手段と、
前記要約映像データ中の映像区間に対し抽出された音声区間の終了時点が当該映像区間の終了時点よりも遅く、且つ、当該音声区間の長さが当該映像区間の長さ以下のときに、当該音声区間の時間的位置を当該映像区間内となるようにずらす音声区間制御手段と、
前記要約映像データ中の映像区間に対し抽出された音声区間の終了時点が当該映像区間の終了時点よりも遅く、且つ、当該音声区間の長さが当該映像区間の長さよりも長いとき、当該映像区間の終了時点が当該音声区間の終了時点と一致あるいは以後となるように、当該映像区間の終了時点を修正する修正手段と、
前記修正手段で修正された映像区間及び前記音声区間制御手段で音声区間をずらした映像区間を含む前記要約映像データ中の各映像区間の前記説明音声の音量を、当該映像区間内の当該説明音声以外の音声よりも大きく設定する音量制御手段と、
を具備したことを特徴とする映像要約装置。 - 前記選択手段で選択された各属性情報を基に、前記要約映像データの説明文を生成する説明文生成手段と、
前記説明文の合成音声を生成する合成音声生成手段と、
さらに具備し、
前記抽出手段は、前記要約映像データ中の各映像区間について、当該映像区間近傍の各音声区間を音声認識することにより、当該映像区間の説明音声として、音声認識結果に前記説明文に含まれる前記属性情報以外の情報が含まれている音声区間を抽出することを特徴とする請求項1または2記載の映像要約装置。 - 前記選択手段で選択された各属性情報を基に、前記要約映像データの説明文を生成する説明文生成手段と、
前記説明文の合成音声を生成する合成音声生成手段と、
さらに具備し、
前記抽出手段は、前記要約映像データ中の各映像区間について、当該映像区間近傍の各音声区間の音声の字幕情報を用いて、当該映像区間の説明音声として、前記字幕情報に前記説明文に含まれる前記属性情報以外の情報が含まれている音声区間を抽出することを特徴とする請求項1または2記載の映像要約装置。 - 映像及び音声を含む時系列的な映像データを記憶する映像記憶手段と、
前記映像データ中の複数の映像区間のそれぞれについて、当該映像区間内の映像の内容を示した属性情報を記憶する属性情報記憶手段と、
前記属性情報記憶手段から、指定されたキーワードを含む属性情報を選択する選択手段と、
前記映像記憶手段に記憶されている映像データのうち、前記選択手段で選択された属性情報に対応する映像区間の映像データを時系列に接続することにより、要約映像データを生成する要約映像生成手段と、
前記選択手段で選択された各属性情報を基に、前記要約映像データの説明文を生成する説明文生成手段と、
前記説明文の合成音声を生成する合成音声生成手段と、
前記映像記憶手段に記憶されている前記映像データに含まれる音声の区切り位置を検出する検出手段と、
前記検出手段で検出された区切り位置で区切られた音声区間のうち前記要約映像データ中の各映像区間近傍の各音声区間を音声認識することにより、当該映像区間の説明音声として、音声認識結果に前記説明文に含まれる前記属性情報以外の情報が含まれている音声区間を抽出する抽出手段と、
前記要約映像データ中の映像区間の終了時点が、当該映像区間に対し前記抽出手段で抽出された音声区間の終了時点と一致あるいは以後となるように、当該映像区間の終了時点を修正する修正手段と、
を具備したことを特徴とする映像要約装置。 - 映像及び音声を含む時系列的な映像データを記憶する映像記憶手段と、
前記映像データ中の複数の映像区間のそれぞれについて、当該映像区間内の映像の内容を示した属性情報を記憶する属性情報記憶手段と、
前記属性情報記憶手段から、指定されたキーワードを含む属性情報を選択する選択手段と、
前記映像記憶手段に記憶されている映像データのうち、前記選択手段で選択された属性情報に対応する映像区間の映像データを時系列に接続することにより、要約映像データを生成する要約映像生成手段と、
前記選択手段で選択された各属性情報を基に、前記要約映像データの説明文を生成する説明文生成手段と、
前記説明文の合成音声を生成する合成音声生成手段と、
前記映像記憶手段に記憶されている前記映像データに含まれる音声の区切り位置を検出する検出手段と、
前記検出手段で検出された区切り位置で区切られた音声区間のうち前記要約映像データ中の各映像区間近傍の各音声区間の音声の字幕情報を用いて、当該映像区間の説明音声として、前記字幕情報に前記説明文に含まれる前記属性情報以外の情報が含まれている音声区間を抽出する抽出手段と、
前記要約映像データ中の映像区間の終了時点が、当該映像区間に対し前記抽出手段で抽出された音声区間の終了時点と一致あるいは以後となるように、当該映像区間の終了時点を修正する修正手段と、
を具備したことを特徴とする映像要約装置。 - 前記映像データ中の各映像区間に対応する属性情報は、当該映像区間内に発生した事象の発生時刻を含むことを特徴とする請求項1、2、5、及び6のうちのいずれか1つに記載の映像要約装置。
- 前記検出手段は、前記映像データに含まれる音声の大きさが、予め定められた値より小さい無音区間の任意の一時点を前記区切り位置として検出することを特徴とする請求項1、2、5、及び6のうちのいずれか1つに記載の映像要約装置。
- 前記検出手段は、前記映像データに含まれる音声の話者の切り替わりを前記区切り位置として検出することを特徴とする請求項1、2、5、及び6のうちのいずれか1つに記載の映像要約装置。
- 前記検出手段は、前記映像データに含まれる音声の文章あるいは句の切れ目を前記区切り位置として検出することを特徴とする請求項1、2、5、及び6のうちのいずれか1つに記載の映像要約装置。
- 映像及び音声を含む時系列的な映像データを記憶する映像記憶手段と、
前記映像データ中の複数の映像区間のそれぞれについて、当該映像区間内の映像の内容を示した属性情報を記憶する属性情報記憶手段と、
を備えた映像要約装置における映像要約方法であって、
前記属性情報記憶手段から、指定されたキーワードを含む属性情報を選択する選択ステップと、
前記映像記憶手段に記憶されている映像データのうち、前記選択ステップで選択された属性情報に対応する映像区間の映像データを時系列に接続することにより、要約映像データを生成する要約映像生成ステップと、
前記映像記憶手段に記憶されている前記映像データに含まれる音声の区切り位置を検出する検出ステップと、
前記検出ステップで検出された区切り位置で区切られた音声区間のなかから、前記要約映像データ中の各映像区間に対し、当該映像区間の説明音声として用いる音声区間を抽出する抽出ステップと、
前記要約映像データ中の映像区間の終了時点が、当該映像区間に対し前記抽出ステップで抽出された音声区間の終了時点と一致あるいは以後となるように、当該映像区間の終了時点を修正する修正ステップと、
前記修正ステップで修正された映像区間を含む前記要約映像データ中の各映像区間の前記説明音声の音量を、当該映像区間内の当該説明音声以外の音声よりも大きく設定する音量制御ステップと、
を含む映像要約方法。 - 映像及び音声を含む時系列的な映像データを記憶する映像記憶手段と、
前記映像データ中の複数の映像区間のそれぞれについて、当該映像区間内の映像の内容を示した属性情報を記憶する属性情報記憶手段と、
を備えた映像要約装置における映像要約方法であって、
前記属性情報記憶手段から、指定されたキーワードを含む属性情報を選択する選択ステップと、
前記映像記憶手段に記憶されている映像データのうち、前記選択ステップで選択された属性情報に対応する映像区間の映像データを時系列に接続することにより、要約映像データを生成する要約映像生成ステップと、
前記映像記憶手段に記憶されている前記映像データに含まれる音声の区切り位置を検出する検出ステップと、
前記検出ステップで検出された区切り位置で区切られた音声区間のなかから、前記要約映像データ中の各映像区間に対し、当該映像区間の説明音声として用いる音声区間を抽出する抽出ステップと、
前記要約映像データ中の映像区間に対し抽出された音声区間の終了時点が当該映像区間の終了時点よりも遅く、且つ、当該音声区間の長さが当該映像区間の長さ以下のときに、当該音声区間の時間的位置を当該映像区間内となるようにずらす音声区間制御ステップと、
前記要約映像データ中の映像区間に対し抽出された音声区間の終了時点が当該映像区間の終了時点よりも遅く、且つ、当該音声区間の長さが当該映像区間の長さよりも長いとき、当該映像区間の終了時点が当該音声区間の終了時点と一致あるいは以後となるように、当該映像区間の終了時点を修正する修正ステップと、
前記修正ステップで修正された映像区間及び前記音声区間制御手段で音声区間をずらした映像区間を含む前記要約映像データ中の各映像区間の前記説明音声の音量を、当該映像区間内の当該説明音声以外の音声よりも大きく設定する音量制御ステップと、
を含む映像要約方法。 - 前記選択ステップで選択された各属性情報を基に、前記要約映像データの説明文を生成する説明文生成ステップと、
前記説明文の合成音声を生成する合成音声生成ステップと、
をさらに含み、
前記抽出ステップは、前記要約映像データ中の各映像区間について、当該映像区間近傍の各音声区間を音声認識することにより、当該映像区間の説明音声として、音声認識結果に前記説明文に含まれる前記属性情報以外の情報が含まれている音声区間を抽出することを特徴とする請求項11または12記載の映像要約方法。 - 前記選択ステップで選択された各属性情報を基に、前記要約映像データの説明文を生成する説明文生成ステップと、
前記説明文の合成音声を生成する合成音声生成ステップと、
をさらに含み、
前記抽出ステップは、前記要約映像データ中の各映像区間について、当該映像区間近傍の各音声区間の音声の字幕情報を用いて、当該映像区間の説明音声として、前記字幕情報に前記説明文に含まれる前記属性情報以外の情報が含まれている音声区間を抽出することを特徴とする請求項11または12記載の映像要約方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006003973A JP4346613B2 (ja) | 2006-01-11 | 2006-01-11 | 映像要約装置及び映像要約方法 |
US11/647,151 US20070168864A1 (en) | 2006-01-11 | 2006-12-29 | Video summarization apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006003973A JP4346613B2 (ja) | 2006-01-11 | 2006-01-11 | 映像要約装置及び映像要約方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007189343A JP2007189343A (ja) | 2007-07-26 |
JP4346613B2 true JP4346613B2 (ja) | 2009-10-21 |
Family
ID=38264754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006003973A Expired - Fee Related JP4346613B2 (ja) | 2006-01-11 | 2006-01-11 | 映像要約装置及び映像要約方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20070168864A1 (ja) |
JP (1) | JP4346613B2 (ja) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8392183B2 (en) | 2006-04-25 | 2013-03-05 | Frank Elmo Weber | Character-based automated media summarization |
US20080269924A1 (en) * | 2007-04-30 | 2008-10-30 | Huang Chen-Hsiu | Method of summarizing sports video and apparatus thereof |
KR101138396B1 (ko) | 2007-09-11 | 2012-04-26 | 삼성전자주식회사 | Iptv 단말기에서 컨텐츠 재생 방법 및 장치 |
US20100023485A1 (en) * | 2008-07-25 | 2010-01-28 | Hung-Yi Cheng Chu | Method of generating audiovisual content through meta-data analysis |
US8425325B2 (en) * | 2009-02-06 | 2013-04-23 | Apple Inc. | Automatically generating a book describing a user's videogame performance |
CA2754173C (en) * | 2009-03-03 | 2016-12-06 | Centre De Recherche Informatique De Montreal (Crim) | Adaptive videodescription player |
WO2011018681A1 (en) * | 2009-08-13 | 2011-02-17 | Youfoot Ltd | Process and method for generating dynamic sport statistics, multilingual sport commentaries, and media tags for association with user generated media content |
US8786597B2 (en) | 2010-06-30 | 2014-07-22 | International Business Machines Corporation | Management of a history of a meeting |
US8687941B2 (en) | 2010-10-29 | 2014-04-01 | International Business Machines Corporation | Automatic static video summarization |
US9792363B2 (en) | 2011-02-01 | 2017-10-17 | Vdopia, INC. | Video display method |
US20120271823A1 (en) * | 2011-04-25 | 2012-10-25 | Rovi Technologies Corporation | Automated discovery of content and metadata |
US9204175B2 (en) * | 2011-08-03 | 2015-12-01 | Microsoft Technology Licensing, Llc | Providing partial file stream for generating thumbnail |
US8914452B2 (en) | 2012-05-31 | 2014-12-16 | International Business Machines Corporation | Automatically generating a personalized digest of meetings |
US10091552B2 (en) * | 2012-09-19 | 2018-10-02 | Rovi Guides, Inc. | Methods and systems for selecting optimized viewing portions |
EP2720172A1 (en) * | 2012-10-12 | 2014-04-16 | Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO | Video access system and method based on action type detection |
KR102025362B1 (ko) * | 2013-11-07 | 2019-09-25 | 한화테크윈 주식회사 | 검색 시스템 및 영상 검색 방법 |
US9972357B2 (en) | 2014-01-08 | 2018-05-15 | Adobe Systems Incorporated | Audio and video synchronizing perceptual model |
US10219048B2 (en) * | 2014-06-11 | 2019-02-26 | Arris Enterprises Llc | Method and system for generating references to related video |
US20160014482A1 (en) * | 2014-07-14 | 2016-01-14 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and Methods for Generating Video Summary Sequences From One or More Video Segments |
KR20160057864A (ko) * | 2014-11-14 | 2016-05-24 | 삼성전자주식회사 | 요약 컨텐츠를 생성하는 전자 장치 및 그 방법 |
EP3032435A1 (en) * | 2014-12-12 | 2016-06-15 | Thomson Licensing | Method and apparatus for generating an audiovisual summary |
KR102306538B1 (ko) * | 2015-01-20 | 2021-09-29 | 삼성전자주식회사 | 콘텐트 편집 장치 및 방법 |
US20170061959A1 (en) * | 2015-09-01 | 2017-03-02 | Disney Enterprises, Inc. | Systems and Methods For Detecting Keywords in Multi-Speaker Environments |
KR20170098079A (ko) * | 2016-02-19 | 2017-08-29 | 삼성전자주식회사 | 전자 장치 및 전자 장치에서의 비디오 녹화 방법 |
EP3430613B1 (en) * | 2016-03-16 | 2019-10-30 | Sony Mobile Communications Inc. | Controlling playback of speech-containing audio data |
KR101830747B1 (ko) * | 2016-03-18 | 2018-02-21 | 주식회사 이노스피치 | 온라인 면접 시스템 및 그 방법 |
CN106210878A (zh) * | 2016-07-25 | 2016-12-07 | 北京金山安全软件有限公司 | 一种画面的提取方法及终端 |
US10606814B2 (en) | 2017-01-18 | 2020-03-31 | Microsoft Technology Licensing, Llc | Computer-aided tracking of physical entities |
US10482900B2 (en) | 2017-01-18 | 2019-11-19 | Microsoft Technology Licensing, Llc | Organization of signal segments supporting sensed features |
US10679669B2 (en) * | 2017-01-18 | 2020-06-09 | Microsoft Technology Licensing, Llc | Automatic narration of signal segment |
US10637814B2 (en) | 2017-01-18 | 2020-04-28 | Microsoft Technology Licensing, Llc | Communication routing based on physical status |
US10635981B2 (en) | 2017-01-18 | 2020-04-28 | Microsoft Technology Licensing, Llc | Automated movement orchestration |
US11094212B2 (en) | 2017-01-18 | 2021-08-17 | Microsoft Technology Licensing, Llc | Sharing signal segments of physical graph |
US10437884B2 (en) | 2017-01-18 | 2019-10-08 | Microsoft Technology Licensing, Llc | Navigation of computer-navigable physical feature graph |
US10939172B2 (en) * | 2017-03-03 | 2021-03-02 | Rovi Guides, Inc. | Systems and methods for addressing a corrupted segment in a media asset |
US10715883B2 (en) | 2017-09-06 | 2020-07-14 | Rovi Guides, Inc. | Systems and methods for generating summaries of missed portions of media assets |
CN110392281B (zh) * | 2018-04-20 | 2022-03-18 | 腾讯科技(深圳)有限公司 | 视频合成方法、装置、计算机设备及存储介质 |
US11252483B2 (en) | 2018-11-29 | 2022-02-15 | Rovi Guides, Inc. | Systems and methods for summarizing missed portions of storylines |
CN110012231A (zh) * | 2019-04-18 | 2019-07-12 | 环爱网络科技(上海)有限公司 | 视频处理方法、装置、电子设备以及存储介质 |
US11430485B2 (en) * | 2019-11-19 | 2022-08-30 | Netflix, Inc. | Systems and methods for mixing synthetic voice with original audio tracks |
CN110769178B (zh) * | 2019-12-25 | 2020-05-19 | 北京影谱科技股份有限公司 | 自动生成足球比赛射门集锦的方法、装置及设备及计算机可读存储介质 |
US10945041B1 (en) * | 2020-06-02 | 2021-03-09 | Amazon Technologies, Inc. | Language-agnostic subtitle drift detection and localization |
US11461090B2 (en) | 2020-06-26 | 2022-10-04 | Whatfix Private Limited | Element detection |
US11372661B2 (en) * | 2020-06-26 | 2022-06-28 | Whatfix Private Limited | System and method for automatic segmentation of digital guidance content |
US11704232B2 (en) | 2021-04-19 | 2023-07-18 | Whatfix Private Limited | System and method for automatic testing of digital guidance content |
US11526669B1 (en) * | 2021-06-21 | 2022-12-13 | International Business Machines Corporation | Keyword analysis in live group breakout sessions |
US11669353B1 (en) | 2021-12-10 | 2023-06-06 | Whatfix Private Limited | System and method for personalizing digital guidance content |
US20230362446A1 (en) * | 2022-05-04 | 2023-11-09 | At&T Intellectual Property I, L.P. | Intelligent media content playback |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1032776A (ja) * | 1996-07-18 | 1998-02-03 | Matsushita Electric Ind Co Ltd | 映像表示方法及び記録再生装置 |
JP4165851B2 (ja) * | 2000-06-07 | 2008-10-15 | キヤノン株式会社 | 記録装置及び記録制御方法 |
US20020051077A1 (en) * | 2000-07-19 | 2002-05-02 | Shih-Ping Liou | Videoabstracts: a system for generating video summaries |
JP3642019B2 (ja) * | 2000-11-08 | 2005-04-27 | 日本電気株式会社 | Avコンテンツ自動要約システム及びavコンテンツ自動要約方法 |
JP4546682B2 (ja) * | 2001-06-26 | 2010-09-15 | パイオニア株式会社 | 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム |
JP2003288096A (ja) * | 2002-03-27 | 2003-10-10 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ情報配信方法、コンテンツ情報配信装置、コンテンツ情報配信プログラム |
US7027124B2 (en) * | 2002-02-28 | 2006-04-11 | Fuji Xerox Co., Ltd. | Method for automatically producing music videos |
JP3621686B2 (ja) * | 2002-03-06 | 2005-02-16 | 日本電信電話株式会社 | データ編集方法、データ編集装置、データ編集プログラム |
JP4359069B2 (ja) * | 2003-04-25 | 2009-11-04 | 日本放送協会 | 要約生成装置及びそのプログラム |
JP3923932B2 (ja) * | 2003-09-26 | 2007-06-06 | 株式会社東芝 | 映像要約装置、映像要約方法及びプログラム |
JP2005229366A (ja) * | 2004-02-13 | 2005-08-25 | Matsushita Electric Ind Co Ltd | ダイジェスト作成装置及びダイジェスト作成方法 |
JP2006019770A (ja) * | 2004-05-31 | 2006-01-19 | Toshiba Corp | 放送受信装置及び放送受信方法、音声再生装置及び音声再生方法 |
US9697231B2 (en) * | 2005-11-09 | 2017-07-04 | Cxense Asa | Methods and apparatus for providing virtual media channels based on media search |
-
2006
- 2006-01-11 JP JP2006003973A patent/JP4346613B2/ja not_active Expired - Fee Related
- 2006-12-29 US US11/647,151 patent/US20070168864A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20070168864A1 (en) | 2007-07-19 |
JP2007189343A (ja) | 2007-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4346613B2 (ja) | 映像要約装置及び映像要約方法 | |
CN107193841B (zh) | 媒体文件加速播放、传输及存储的方法和装置 | |
JP4757599B2 (ja) | 音声認識システムと音声認識方法およびプログラム | |
JP2986345B2 (ja) | 音声記録指標化装置及び方法 | |
US8311832B2 (en) | Hybrid-captioning system | |
WO2008050649A1 (fr) | Système, procédé et programme de récapitulation de contenu | |
JP4873018B2 (ja) | データ処理装置、データ処理方法、及び、プログラム | |
WO2009084554A1 (ja) | テキスト分割装置とテキスト分割方法およびプログラム | |
US6463412B1 (en) | High performance voice transformation apparatus and method | |
US20060136226A1 (en) | System and method for creating artificial TV news programs | |
US20110093263A1 (en) | Automated Video Captioning | |
JP5149107B2 (ja) | 音響処理装置およびプログラム | |
Lambourne et al. | Speech-based real-time subtitling services | |
WO2009122779A1 (ja) | テキストデータ処理装置、方法、プログラムが格納された記録媒体 | |
JP6327745B2 (ja) | 音声認識装置、及びプログラム | |
JP2015212732A (ja) | 音喩認識装置、及びプログラム | |
JP5398295B2 (ja) | 音声処理装置、音声処理方法及び音声処理プログラム | |
JP2013025763A (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
CN112382310A (zh) | 一种人声音频录制方法和装置 | |
JP4736478B2 (ja) | 音声書き起こし支援装置およびその方法ならびにプログラム | |
JP3923932B2 (ja) | 映像要約装置、映像要約方法及びプログラム | |
JP2004343488A (ja) | 字幕挿入方法、字幕挿入システム、および字幕挿入プログラム | |
JP3881620B2 (ja) | 話速可変装置及び話速変換方法 | |
JP2004233541A (ja) | ハイライトシーン検出システム | |
JP3803302B2 (ja) | 映像要約装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081009 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081014 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090623 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090714 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4346613 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130724 Year of fee payment: 4 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313121 Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |