JP4937218B2 - メタデータ編集装置及びメタデータ生成方法 - Google Patents

メタデータ編集装置及びメタデータ生成方法 Download PDF

Info

Publication number
JP4937218B2
JP4937218B2 JP2008235143A JP2008235143A JP4937218B2 JP 4937218 B2 JP4937218 B2 JP 4937218B2 JP 2008235143 A JP2008235143 A JP 2008235143A JP 2008235143 A JP2008235143 A JP 2008235143A JP 4937218 B2 JP4937218 B2 JP 4937218B2
Authority
JP
Japan
Prior art keywords
keyword
metadata
candidate
video
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008235143A
Other languages
English (en)
Other versions
JP2010068434A (ja
Inventor
友則 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008235143A priority Critical patent/JP4937218B2/ja
Publication of JP2010068434A publication Critical patent/JP2010068434A/ja
Application granted granted Critical
Publication of JP4937218B2 publication Critical patent/JP4937218B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Description

この発明は、例えば放送番組で使用する映像/音声等の素材(コンテンツ)をVTR(Video Tape Recorder)テープから再生し、この再生データをMXF(material exchange format)ファイル化してビデオサーバに記録する際に、各素材の関連情報(メタデータ)を生成して、この関連情報をMXFファイルに対応付けて登録するメタデータ編集装置及びメタデータ生成方法に関する。
従来、放送局では、膨大な番組収録データがアーカイブとしてVTRテープに保存されているが収容スペースも大きくなり、これらの収録データを電子データで保存することが進められている。アーカイブは、番組タイトル、撮影時期や、内容概要等からなる情報(以下、編集情報と呼ぶ。)がコンテンツを記録したテープと共にラベルや添付資料により保存管理されているが、これらの編集情報と、映像音声のコンテンツ情報とを合わせて電子化することが重要である。
保存に際しては、単なる記憶媒体の変更に留まらず、編集情報に加えて収録内容に係わるデータを記述したメタデータによって、VTRテープ等に記録されている映像、及び音声のコンテンツの符号化データをカプセル化して保存するMXFファイル化が行われている(例えば、特許文献1)。
特開2007−124368公報。
しかし、この場合でもコンテンツ内容詳細は不明なのでテープを改めて再生して、オペレータがコンテンツを繰り返し視聴して必要な情報を抽出し、その情報をキーボード等の端末入力手段によりにより、キーワードや編集情報に係わるメタデータとして記憶媒体に書き込むための入力作業が必要であった。
そこで、この発明の目的は、再生中のコンテンツから自動的にMXFファイル化に必要なメタデータを抽出、自動生成するメタデータ編集装置、メタデータ生成方法を提供することにある。
上記目的を達成するために、この発明に係るメタデータ編集装置は、記録媒体から再生される番組素材データを符号化しかつ規格化されたファイル構造のファイル素材データに生成して記録するビデオサーバに対し、番組素材データの素材関連情報としてのメタデータをファイル素材データに対応付けて記録するメタデータ編集装置において、メタデータに登録するキーワードに関わるコマンド及びデータを入力する入力手段と、番組素材データをビデオサーバに記録するときに、番組素材データからメタデータに登録するキーワードの候補を抽出するキーワード抽出手段と、キーワード候補の抽出またはキーワード候補を選択するために参照する参照キーワード候補を記憶するキーワード候補記憶手段と、キーワード抽出手段によって抽出されるキーワード候補とキーワード候補記憶手段に記憶された参照キーワード候補との照合により登録するキーワードを選択し、選択したキーワードを登録したメタデータを生成するメタデータ生成手段とを備えるようにしたものである。
なお、キーワード抽出手段は、音声認識、テロップ及び映像シーン認識の少なくとも1つによってキーワード候補を抽出する。
この構成によれば、素材データに含まれる既知の参照キーワード候補を予め辞書として用意しておき、番組素材データから音声認識、テロップ及び映像シーン認識の少なくとも1つによってキーワード候補を抽出し、キーワード候補と参照キーワード候補とを順次比較して最も似ていると思われるものをメタデータに登録するキーワードとして選択すれば、効率良くメタデータを生成することができる。
キーワード抽出手段は、テロップまたは映像情報と音声認識データとを相互に比較してキーワード候補を抽出する。
この構成によれば、テロップまたは映像情報と音声認識データとを相互に比較することで、より精度の高いキーワードを抽出できる。
キーワード候補記憶手段は、類似語、同義語、関連語の検索可能なシソーラス辞書機能を備えて参照キーワード候補を記憶し、キーワード抽出手段は、番組名を検索語として予め用意した辞書の中からキーワードを得、メタデータ生成手段は、キーワード抽出手段が出力とキーワード候補記憶手段に記憶された参照キーワード候補との相関を取り、出現頻度から前記メタデータを作成する。
この構成によれば、番組名を指定するだけで、番組素材に関する最適なキーワード候補を得ることができ、このキーワード候補と既知の参照キーワード候補との相関をとることで、出現頻度の高いキーワードをメタデータに登録するキーワードとして生成できるので、メタデータの生成における信頼性をさらに高めることができる。
以上詳述したようにこの発明によれば、再生中のコンテンツから自動的にMXFファイル化に必要なメタデータを抽出、自動生成するメタデータ編集装置、メタデータ生成方法を提供することができる。
以下、この発明の実施形態について図面を参照して詳細に説明する。
図1は、この発明に係るメタデータ編集装置を用いるテープレス移行装置(以下、TMと略す)の一実施形態の機能系統図である。
図1において、TMは、VTRの様なテープ再生部Rと、テープ再生部Rから出力されるコンテンツをENCS1で符号化した映像ファイルV1をメタデータM1でラッピングするラッピング部S2でMXFファイル化して記憶蓄積部S3に蓄積するビデオサーバSとメタデータ編集部Pとを備える。
なお、図示しないが、これらテープ再生部R、メタデータ編集部P、ビデオサーバSにテープからの電子アーカイブ化処理(テープレス移行)を行う場合、これらの装置間を接続する制御網(データネットワーク)NWに接続されるASM(Ascetment Management System図示せず)、又は、スタジオの制御卓から入力されるコマンドやデータによって動作が制御、監視される。又、後述の様にメタデータ編集部Pの入出力手段から入力される、データ、コマンドにより動作制御が行われる。
メタデータ編集部Pは、テープ再生部Rから出力されるコンテンツである映像音声信号を映像信号と音声信号に分離するセパレータ(映像音声分離部)P1、分離された映像信号から更に文字情報であるテロップと元の映像情報に分離してテロップメモリ部P5へ出力するテロップ分離部P2、映像信号を、所定の映像辞書P6と比較参照し、映像シーンをカテゴライズしたシーン情報を出力する映像認識処理部P3、分離された音声信号を音声認識し、所定の単語を記憶蓄積した音声辞書P7と比較参照することにより、コンテンツに係わるキーワード候補に変換して出力する音声認識処理部P4、音声認識処理部P4、テロップメモリP5部から出力されるデータを受信しメタデータを生成して出力するメタデータ生成部P8、メタデータ生成部P8はじめメタデータ編集部Pに映像と音声の同期情報を与える為の時刻情報を出力するタイマカウンタP9、出力されたメタデータを記憶するメタデータ蓄積部P10、メタデータ蓄積部P10からビデオサーバSにメタデータを転送する通信インタフェース部P11と、例えば、マウス、キーボードやディスプレイの様なメタデータ生成部P8との間でメタデータ作成に係わるデータを入力、確認する入出力部P12とを備える。
メタデータ編集部Pにおいて、入力される映像音声は、映像音声分離部P1で、映像と音声の信号に分離され、各信号は内蔵される符号化部(ENC)でデジタル化されてテロップ分離処理部P2と音声認識処理部へ出力され、以降、各部ではデジタル信号処理が行われる。この各出力信号は、タイマカウンタP9と同期して例えば、信号先頭からの経過時間が分かるようにタイムタグが付与される。
テロップ分離部P2は、映像信号から文字抽出処理を実行する。抽出された文字、即ちテロップデータは、更に単語に分離処理され、タイムタグ情報と共にテロップメモリ部P5へ保存蓄積される。
音声認識処理部P4でも同様に、音声信号から会話、朗読音声等を認識処理し音声辞書P7に記憶蓄積された参照キーワード候補と参照され、キーワード候補となる単語の変換候補が抽出される。この変換候補は、テロップメモリ部P5に保存された単語と比較参照されるか、またはオペレータが確認することにより、メタデータのキーワード作成用の候補として選択される。つまり、単語候補が出現するタイミングの前後に生じるテロップが有れば、そのテロップと一致する単語である場合、同音異義語から的確な単語を選択してキーワード候補とする処理が音声認識処理部P4において行われる。
映像認識処理部P3は、予め、放送番組の種別、例えば、ニュース、各種スポーツ中継、座談会、劇場中継等のシーン特有の映像パターンを、番組種別名称と組にして画像(シーン)サンプルとして映像辞書に保存し、その基本パターンと、再生装置R経由入力された映像とパターンマッチングをしてシーンの種別を判定する。この判定されたシーンの種別名は、タイムタグと共に、映像認識処理部P3に一次記憶され、メタデータ生成処理部P8へ出力される。
図2は、図1に示されるメタデータ編集部Pの動作処理を説明する構成系統図である。
図2において、セパレータP1、映像認識処理部P3、音声認識処理部P4、メタデータ生成部P8は、更に図示される内部構成を備え、それらの間は内部バス1で接続されている。そして、図示しないがバスインタフェースにより装置内バスと内部バス1との間でデータやコマンドが入出力している。
AMS(図示せず)からのコマンドによりテープ再生部Rからコンテンツ単位でビデオ信号(映像・音声)がメタデータ編集装置PとビデオサーバSへ入力される。
この場合、AMSの入力手段等から両装置へは、両装置で処理されるコンテンツの対応をとるようにこのコンテンツに対して所定の識別情報、名称が指定入力される。
セパレータP1に入力された映像・音声信号は、セパレータP1の多重分離部11で映像と音声の信号に分離され、更に映像エンコーダ(ENC)12と音声エンコーダ(ENC)13で映像と音声とのデジタル信号に変換される。これらのデジタル信号は、テープに記録されたタイムタグ情報と照合可能であり、装置内バスから更にメタデータ編集部P内の内部バス1に向けてタイムタグ情報と合わせて出力される。
映像信号は、テロップ分離部P2と映像認識処理部P3へ入力され、テロップ分離部P2では、映像信号から更にテロップ情報が抽出され、テキストデータに復元されて内部バス1を介してタイムタグが付加されテロップメモリ部P5に入力記憶される。
テロップ分離部P2は、テロップが有るタイミングでは「テロップフラグ」を内部バス1を介して音声認識処理部P4、映像認識処理部P3、メタデータ生成部P8とへ出力し、これらの構成で同じテロップと映像、音声を同期して処理するための参照情報を供給する。
映像認識処理部P3では前述の様に入力された映像信号が所定のシーンパタン抽出方法(例えば、内部の標本シーンパタンとマッチング抽出をする)で分類する。そして分類された抽出データを、映像辞書参照部31が更に映像辞書P6に記憶保存しているメタデータの参照キーワード候補用のシーンパタンのサンプルと比較照合してシーン種別をキーワード候補として映像認識処理部P3の装置内バスへ出力する。
CPU32は、サンプルに付与されている参照キーワード候補(例えば、野球シーンのパターン)と対応してタイムタグと共に「野球、00:10:20」の様なキーワード候補をメモリ33に書き込み記憶する。
また、報道番組等で表示されたテロップの表示タイミングでは、テロップフラグを受信するので、CPU32は、映像辞書P6を参照して得たキーワード候補とテロップメモリP5から得たテキストデータを更に加え、例えば、「風景,00:07:20,自給分が上がって、」をメモリ33に記憶する。
音声認識処理部P4では、音声抽出部41が音声ENC13から入力される符号化音声データから取り出した音声情報を音声辞書参照部42が音声辞書P7の音声認識用の辞書データ、言い換えれば、参照キーワード候補でもある辞書データと比較参照して音声認識による文字入力データを生成し、メモリ43にメタデータのキーワード候補として書き込み記憶する。
CPU44は、テロップ分離部P2からテロップフラグを受信しているタイミングで、更にテロップデータからテロップのテキストデータを受信し、更に生成された文字入力データと比較照合してテロップのテキストデータと整合性が良い単語に修正変換して、キーワード候補としてメモリ43に書き込み記憶する。
例えば、上記の例で、音声のみの場合、「じきゅうぶん」に対して「時給分」、「自給分」、「持久分」がテキストへの変換候補になるが、CPU44は、テロップ参照部45を参照することにより「自給分」を候補に選択してメモリ43へ、タイムタグと共に書き込み記録する。
なお、テロップ表示タイミングと音声認識処理によるテキスト変換タイミングとを、必ずリアルタイムの同じ時刻(タイミングに行う必要は無い。テロップ表示が有るタイミングに対してテロップデータにタイムタグを付与してメモリ43に記憶する。
逆に言うとタイムタグがあるタイミングのみテロップがあるので、音声認識処理部P4は、タイムタグ出力が有るタイミングのみ音声変換を下データとテロップとを照合比較すれば良い。
以上が、メタデータに保存記憶されるキーワード候補の作成手順である。MXF化のメタデータとして登録、使用されるキーワードは更に後述の処理手順で生成される。
MXFファイル化に用いられるメタデータは、番組名称や、報道番組、劇場映画、ドラマなどの番組種別の編集情報が使用される。そして、編集情報に加えて、更にその番組内容の傾向など、あらすじに準じるような、番組の特徴を示す為のキーワードが付帯記録され、アーカイブ化された番組を後日検索する場合に用いられる。
これらのキーワードは、重要度、出現度などにより、地名、人物に加え、様々な用語が採用される。従来マニュアル等はあるにしても、編集オペレータが番組を視聴してコンテンツに出現した発言やテロップなどからキーワードを選択していた。この様に、メタデータ作成は、番組を通して視聴して確認しなければならず時間と人手を要しており、アーカイブ作成の大きな負担となっている。
本発明の実施形態のメタデータ編集部Pは、上記の音声、映像認識処理部P3,P4、テロップメモリP5から得たメタデータにするキーワード候補から自動的にキーワードを生成する。
即ち、メタデータ編集部Pでは、コンテンツを通して得たキーワード候補からシソーラス辞書81を利用する統計処理により、キーワードを生成する。
図3は、キーワード候補からキーワードを生成する動作手順を示すフローチャートである。
ここでは、タイトルが「気象異常」の報道特別番組開始後5分間で実行されるキーワード抽出処理を例にして説明する。
最初にオペレータは、テープ再生部RにVTRテープを装着後、メタデータ生成部P8の入出力部P12から、番組名称の「気象異常」、又は、テープの識別情報と、例えば、コマンドとして「EDIT」、「S−05m:KW」を入力して記録先頭から5分間の処理時間を設定してキーワードを抽出する指示を行う。
データネットワークNWを介してこのコマンドは、メタデータ編集部Pのメタデータ生成部P8、音声認識処理部P4、映像認識処理部P3、テロップ分離部P2、セパレータP1、テープ再生部R、ビデオサーバSへ入力される。
そして、コマンドを受信したテープ再生部Rは、テープの再生を開始して映像音声信号の出力を開始し、メタデータ編集部Pがメタデータ生成を開始する等それぞれが、メタデータ作成に係わる動作を開始する。
メタデータ編集部Pは、映像音声信号を入力し、前述の如く音声、映像認識処理部P3,P4の各メモリ33、43、及びテロップメモリP5へメタデータに使用するキーワード候補が書き込み記憶される(ステップs1)。
続いてメタデータ生成部P8のCPU82は、タイマカウンタP9を参照し、開始から5分経過するまでのキーワード候補を内部バス1を介して音声認識処理部P4、テロップデータ部P5、映像認識処理部P3の各メモリ33,43から読み出して自装置のメモリ83へ転送書き込する(ステップs2)。
CPU82は、このタイムタグデータを参照して最初の5分間の間、キーワード抽出と選択の処理を行ってメタデータの生成を行う。
また、このメタデータ生成時間は、入出力部P12から設定するものでも良いし、前編通して行うものでも、適宜設定されるものである。
次に、CPU82は、音声認識処理部P4から取得したキーワード候補を先頭から読み出し、出現頻度の高い単語から順位付けした音声変換キーワードリストVWLを作成し、メモリ83へ書き込み記憶する(ステップs3)。例えば、「気温(10)、温度(10)、雨量(8)、雨の日(5)、晴天(4)、平年(3)・・・・」のリストが記憶された内容である。
また、CPU82は、テロップに出現した単語も同様に、例えば、「気温(2)、日照時間(1)、降雨量(1)・・・」のようなテロップキーワードリストTWLを作成、メモリ83に書き込み記憶する(ステップs4)。
さらに、CPU82は、映像認識処理部P3のメモリ33から読み出したシーン種別名も同様であり、例えば、「畑風景(3U)、グラフ図1(2U)、文章画面(1U)・・・・」がシーンリストSLとしてメモリ83に書き込み記憶する(ステップs5)。ここで(1U)は例えば、2秒間を所定の表示単位時間として表される表示時間長である。
映像認識処理部P3のCPU32は、番組名称「気象異常」を検索語としてシソーラス辞書81と参照する(ステップs6)。このシソーラス辞書81は、入力された単語に対する類似語、派生語、また関連語等を出力する辞書である。「気象異常」に対しては、例えば、「干ばつ、日照り、日照不足、冷害、低温・・・・」の様に数十の単語が出力されるものである。
CPU82は、検索語に対するシソーラス辞書81の出力リストと前出の各キーワード候補リスト、シーン種別名との所定の方法による相関度を調べる。例えば、シソーラ須辞書との一致回数が多い単語を調べ同様に一致数の多い単語からリストにする(ステップs7)。
その結果、例えば「気温上昇(8)」、干ばつ(5)、降雨量(4)、冷害(3)・・・・」の様な単語が出力され、CPUは、所定の、例えば、上位3つのキーワード候補としてあげられた単語を、キーワードとして選択し、入出力部P12のディスプレイに表示させる(ステップs8)。
この状態でオペレータが、キーワードに採用すると判定して入出力部P12において「Y」を入力したとする。そうするとCPU82は、ステップs9からステップs10に移行してここでそのキーワードをメタデータ蓄積部P10に蓄積する。
一方、選択内容に不満足で「N」が入力された場合、CPU82は、ステップs9からステップs11に移行してここで3位以下の、例えば、6位までのキーワード候補を画面に表示し、オペレータにキーワードの採用入力を促す。
そして、登録するキーワードが採用され、更にオペレータがビデオサーバSへの送信コマンドを入力した場合か、又は、ビデオサーバSからの読み出しコマンドをデータネットワークと通信インタフェース部P11を介して受信した場合(ステップs12)、この蓄積されたデータ、即ちキーワードが登録されたメタデータはビデオサーバSへデータネットワークNWと通信インタフェース部P11を介して転送され、所定の処理手順で当該コンテンツのMXFファイル化に用いられる。
このキーワード登録方法であると、単純に番組中出現した候補の出現回数のみからのみにより選択した場合よりもシソーラス辞書81を活用することにより番組名からの関連語までも含めて当該単語の主旨を反映した単語の出現回数が統計上出現するので、概念的に番組作成の意図に適合したキーワードが生成される。
また、音声認識処理部P4で記憶されるキーワード候補は、音声からテキストの単語に変換される場合、複数候補があり、それを選択出来るテロップ情報が無い場合、シソーラス辞書との出力と相関性を調べることにより候補を1つに選択しなくても正しくキーワード候補とすることができる。
例えば、音声認識処理によって取得した“かな”を“漢字”に変換する機能のみでは、「てんき」に対して「天気」が正しい変換候補で有る場合でも、「転記」、「転機」、「転帰」から選択する基準は無い。しかし、その場合、「気象異常」のシソーラス辞書との相関を取れば、正しい変換候補の「天気」がキーワードとの相関性が一番高いので正しくキーワード候補として選択される。
また、上記説明では、テロップと、音声認識処理と、シーン種別から挙げられた候補のキーワード作製に対する重み度を均等にしているが、オペレータが入出力部から各処理、又は単語への重み付けを入出力部から指定しても良い。
更に、番組名を検索語としてシソーラス出力リストを用いず、全てのキーワード候補に対するシソーラス出力をリスト化し、それらの相互間で更に相関を求める様にしても良い。更にシソーラス辞書自体を1種類だけでなく、複数のシソーラス辞書から専門用語に特化されたものを選択して基準にするか、もしくは多種のものを組合わせて用いるものであっても良い。
また、音声認識処理部では、音声認識によりアナウンサや出演人物等を特定し、メタデータとして抽出するものであっても良い。この音声で特定された人物に関するシソーラスデータを専門辞書として準備しておき、例えば、複数人物が登場しているもので有れば、座談会の様な分類データをキーワードとして生成するものであっても良い。
上記実施形態では、参照キーワード候補を予め辞書データとして映像認識処理部P3、音声認識処理部P4及びメタデータ生成部P8にそれぞれ備えておく。テープ再生部Rで再生された番組素材データからテロップ分離部P2、映像認識処理部P3、音声認識処理部P4にて映像、音声辞書データを参照してキーワード候補を抽出し、メタデータ生成部P8にて抽出された各キーワード候補をシソーラス辞書81と順次比較し、出現頻度の高いキーワード候補、又はシソーラス辞書81の参照キーワード候補との一致回数が多いものをオペレータに提示する。
そして、オペレータにより確認、選択されたキーワード候補が入出力手段12から入力されると、それをキーワードとして登録したメタデータを生成してビデオサーバSに転送することにより、効率良く的確なキーワードが登録されたメタデータを生成することができる。
この発明に係るメタデータ編集装置を用いるテープレス移行装置の一実施形態の機能系統図。 上記図1に示されるメタデータ編集部の動作処理を説明する構成系統図。 上記図1に示されるメタデータ編集部において、キーワード候補からキーワードを生成する動作手順を示すフローチャート。
符号の説明
1…内部バス、11…多重分離部、12…映像エンコーダ、13…音声エンコーダ、31…映像辞書参照部、32,44,82…CPU、33,43,83…メモリ、41…音声抽出部、42…音声辞書参照部、45…テロップ参照部、S…ビデオサーバ、R…テープ再生部、P…メタデータ編集部、P1…セパレータ(映像音声分離部)、P2…テロップ分離部、P3…映像認識処理部、P4…音声認識処理部、P5…テロップメモリ部、P6…映像辞書、P7…音声辞書、P8…メタデータ生成部、P9…タイマカウンタ、P10…メタデータ蓄積部、P11…通信インタフェース部、P12…入出力部。

Claims (6)

  1. 記録媒体から再生される番組素材データを符号化しかつ規格化されたファイル構造のファイル素材データに生成して記録するビデオサーバに対し、前記番組素材データの素材関連情報としてのメタデータを前記ファイル素材データに対応付けて記録するメタデータ編集装置において、
    前記メタデータに登録するキーワードに関わるコマンド及びデータを入力する入力手段と、
    前記再生される番組素材データを映像信号と音声信号とに分離する映像/音声分離手段と、
    前記分離された映像信号からテロップ情報を抽出するテロップ処理手段と、
    前記分離された映像信号及び前記分離された音声信号から、1つまたは複数のキーワードから成るキーワード候補の抽出または前記キーワード候補を選択するために参照する参照キーワード候補を記憶する辞書記憶手段と、
    前記分離された映像信号と前記辞書記憶手段に記憶された参照キーワード候補と比較参照することで、映像シーン情報としてのキーワード候補を抽出し、前記分離された音声信号と前記辞書記憶手段に記憶された参照キーワード候補と比較参照することで、音声認識情報としてのキーワード候補を抽出するキーワード候補抽出手段と、
    前記キーワード候補抽出手段により抽出されるキーワード候補及びテロップ処理手段により抽出されるテロップ情報から前記登録するキーワードを選択し、前記選択したキーワードを登録したメタデータを生成するメタデータ生成手段とを具備したことを特徴とするメタデータ編集装置。
  2. 前記キーワード候補抽出手段は、前記音声認識情報と、テロップ情報及び映像シーン認識情報とを相互に比較して前記キーワード候補を抽出し、
    前記メタデータ生成手段は、前記キーワード候補抽出手段によって抽出されるキーワード候補と前記辞書記憶手段に記憶された参照キーワード候補とが一致した場合に、その一致したキーワード候補をオペレータに報知し、この報知に対しオペレータが当該キーワード候補を前記登録するキーワードとする選択指示を入力した場合に当該キーワードを前記メタデータとして作成することを特徴とする請求項1記載のメタデータ編集装置。
  3. 前記メタデータ生成手段は、類似語、同義語、関連語の検索可能なシソーラス辞書機能を備えて前記参照キーワード候補を記憶し、
    前記キーワード候補抽出手段は、番組名を検索語として予め用意した辞書の中からキーワードを得、
    前記メタデータ生成手段は、前記キーワード候補抽出手段出力と前記辞書記憶手段に記憶された参照キーワード候補との相関を取り、出現頻度から前記メタデータを作成することを特徴とする請求項1または2記載のメタデータ編集装置。
  4. 記録媒体から再生される番組素材データを符号化しかつ規格化されたファイル構造のファイル素材データに生成して記録するビデオサーバに対し、前記番組素材データの素材関連情報としてのメタデータを前記ファイル素材データに対応付けて記録するメタデータ編集方法において、
    前記メタデータに登録するキーワードに関わるコマンド及びデータを入力する第1のステップと、
    前記再生される番組素材データを映像信号と音声信号とに分離する第2のステップと、
    前記分離された映像信号からテロップ情報を抽出する第3のステップと、
    前記分離された映像信号及び前記分離された音声信号から、1つまたは複数のキーワードから成るキーワード候補の抽出または前記キーワード候補を選択するために参照する参照キーワード候補をメモリに記憶する第4のステップと、
    前記分離された映像信号と前記メモリに記憶された参照キーワード候補と比較参照することで、映像シーン情報としてのキーワード候補を抽出し、前記分離された音声信号と前記メモリに記憶された参照キーワード候補と比較参照することで、音声認識情報としてのキーワード候補を抽出する第5のステップと、
    前記第5のステップにより抽出されるキーワード候補及び第3のステップにより抽出されるテロップ情報から前記登録するキーワードを選択し、前記選択したキーワードを登録したメタデータを生成する第6のステップとを備えることを特徴とするメタデータ生成方法。
  5. 前記第5のステップは、前記音声認識情報と、テロップ情報及び映像シーン認識情報とを相互に比較して前記キーワード候補を抽出し、
    前記第6のステップは、前記第5のステップによって抽出されるキーワード候補と前記メモリに記憶された参照キーワード候補とが一致した場合に、その一致したキーワード候補をオペレータに報知し、この報知に対しオペレータが当該キーワード候補を前記登録するキーワードとする選択指示を入力した場合に当該キーワードを前記メタデータとして作成することを特徴とする請求項4記載のメタデータ生成方法。
  6. 前記第のステップは、類似語、同義語、関連語の検索可能なシソーラス辞書機能を備えて前記参照キーワード候補を記憶し、
    前記第のステップは、番組名を検索語として予め用意した辞書の中からキーワードを得、
    前記第のステップは、前記第1のステップ出力と前記メモリに記憶された参照キーワード候補との相関を取り、出現頻度から前記メタデータを作成することを特徴とする請求項4または5記載のメタデータ生成方法。
JP2008235143A 2008-09-12 2008-09-12 メタデータ編集装置及びメタデータ生成方法 Expired - Fee Related JP4937218B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008235143A JP4937218B2 (ja) 2008-09-12 2008-09-12 メタデータ編集装置及びメタデータ生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008235143A JP4937218B2 (ja) 2008-09-12 2008-09-12 メタデータ編集装置及びメタデータ生成方法

Publications (2)

Publication Number Publication Date
JP2010068434A JP2010068434A (ja) 2010-03-25
JP4937218B2 true JP4937218B2 (ja) 2012-05-23

Family

ID=42193580

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008235143A Expired - Fee Related JP4937218B2 (ja) 2008-09-12 2008-09-12 メタデータ編集装置及びメタデータ生成方法

Country Status (1)

Country Link
JP (1) JP4937218B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11367283B2 (en) 2017-11-01 2022-06-21 Samsung Electronics Co., Ltd. Electronic device and control method thereof

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5545877B2 (ja) * 2011-01-28 2014-07-09 日本電信電話株式会社 コンテンツ認識モデル学習装置、コンテンツ認識モデル学習方法及びコンテンツ認識モデル学習プログラム
KR101868936B1 (ko) * 2011-10-25 2018-06-20 주식회사 케이티 키워드 추출 및 정련 시스템과 그 방법
JP6622662B2 (ja) * 2016-07-04 2019-12-18 富士フイルム株式会社 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP6707621B1 (ja) 2018-12-28 2020-06-10 株式会社ラムダシステムズ 情報処理装置、情報処理方法および情報処理プログラム
WO2021039129A1 (ja) * 2019-08-29 2021-03-04 ソニー株式会社 情報処理装置、情報処理方法、プログラム
JP7456817B2 (ja) * 2020-03-18 2024-03-27 株式会社日立国際電気 アーカイブシステム
JP6902764B1 (ja) * 2020-12-15 2021-07-14 ソプラ株式会社 メタデータ抽出プログラム
CN118055292A (zh) * 2022-05-20 2024-05-17 北京百度网讯科技有限公司 视频处理方法、装置、设备以及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001298682A (ja) * 2000-04-10 2001-10-26 Sony Corp プロダクションシステム及びプロダクション方法
JP2002171481A (ja) * 2000-12-04 2002-06-14 Ricoh Co Ltd 映像処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11367283B2 (en) 2017-11-01 2022-06-21 Samsung Electronics Co., Ltd. Electronic device and control method thereof

Also Published As

Publication number Publication date
JP2010068434A (ja) 2010-03-25

Similar Documents

Publication Publication Date Title
JP4937218B2 (ja) メタデータ編集装置及びメタデータ生成方法
EP1357542B1 (en) A video retrieval data generation apparatus and a video retrieval apparatus
US10034028B2 (en) Caption and/or metadata synchronization for replay of previously or simultaneously recorded live programs
US8966360B2 (en) Transcript editor
CN101202864B (zh) 动画再现装置
KR101115701B1 (ko) 음성 인식 기술을 이용하여 생성된 메타데이터로 영상 콘텐츠에 주석을 달기 위한 방법 및 장치
US20050228665A1 (en) Metadata preparing device, preparing method therefor and retrieving device
CN101132508A (zh) 记录与再现设备及方法,影像捕获与记录设备及方法
KR101478918B1 (ko) 캡션 자막 보정 장치 및 캡션 자막 보정 방법
CN106790558B (zh) 一种影片多版本整合存储和提取系统
JP2004153764A (ja) メタデータ制作装置及び検索装置
JP2004302175A (ja) 音声認識システム、音声認識方法及び音声認識プログラム
JP2002245066A (ja) 情報検索装置及び方法、並びに記憶媒体
KR101783872B1 (ko) 동영상 검색 시스템 및 방법
US10915715B2 (en) System and method for identifying and tagging assets within an AV file
KR100404322B1 (ko) 멀티모달 특징 기반의 뉴스 비디오 요약 방법
JP2002171481A (ja) 映像処理装置
JP3607228B2 (ja) 映像検索データ生成装置および映像検索データ生成方法並びに映像検索装置および映像検索方法
JP2002324071A (ja) コンテンツ検索システム、コンテンツ検索方法
JP2007201573A (ja) 情報処理装置、情報処理方法、およびプログラム
JP3985656B2 (ja) 映像索引付加方法及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2007006116A (ja) 映像インデキシング装置
Palmer et al. Multimedia information extraction in a live multilingual news monitoring system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110927

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120221

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150302

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4937218

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150302

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees