JP2007174246A - 映像情報処理方法、映像情報処理プログラム及び映像情報処理装置 - Google Patents

映像情報処理方法、映像情報処理プログラム及び映像情報処理装置 Download PDF

Info

Publication number
JP2007174246A
JP2007174246A JP2005368700A JP2005368700A JP2007174246A JP 2007174246 A JP2007174246 A JP 2007174246A JP 2005368700 A JP2005368700 A JP 2005368700A JP 2005368700 A JP2005368700 A JP 2005368700A JP 2007174246 A JP2007174246 A JP 2007174246A
Authority
JP
Japan
Prior art keywords
data
character
video information
information processing
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005368700A
Other languages
English (en)
Inventor
Osamu Isaka
治 井坂
Haruo Kochi
晴雄 東風
Mitsuru Takahashi
充 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daikin Industries Ltd
Original Assignee
Daikin Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daikin Industries Ltd filed Critical Daikin Industries Ltd
Priority to JP2005368700A priority Critical patent/JP2007174246A/ja
Publication of JP2007174246A publication Critical patent/JP2007174246A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】字幕情報を利用して検索が可能であり、また、携帯電話端末等の表示能力に制限がある端末においても的確な表示を行なうことができるようにする。
【解決手段】表示選択字幕データデコーダ704は、8単位符号に対応するテキストを特定するテキストデータに変換する。外字データが含まれる場合、解析処理部705は、検出したビットマップを用いて外字データ記憶部71に記録された外字表を検索する。ビットマップに対応するテキストの登録がある場合には、解析処理部705は、外字変換を行なう。一方、ビットマップデータの登録がない場合には、解析処理部705は、オペレータ通知を行ない、外字データの登録指示を行なう。そして、テキスト変換されたデータと外字変換されたデータとを結合して字幕メタデータを生成する。
【選択図】図3

Description

本発明は、字幕情報を利用して検索が可能であり、また、携帯電話端末等の表示能力に制限がある端末においても的確な表示を行なうことができる映像情報処理方法、映像情報処理プログラム及び映像情報処理装置に関する。
テレビジョン放送として放送される番組のデータには、映像データと音声データが含まれている。そして、放送される番組データには、表示させるか否かをユーザ側で選択可能な字幕データが含まれている場合がある。このような選択可能な字幕データは、一般にクローズドキャプション(closed caption)と称され、主に、聴覚障害者用に開発されたものである。この字幕の中には、出演者の会話だけではなく、例えば、BGMや効果音などの説明も含まれる。
このクローズドキャプションは、テレビジョン信号の21番目の水平走査線に、画面に関する音声等を文字コード化したものを挿入する。クローズドキャプションデータは、専用のデコーダによってテレビジョン信号から分離することができる。
このようなクローズドキャプションデータに基づき映像を検索する映像検索装置に関する技術が開示されている(例えば、特許文献1、特許文献2を参照。)。この特許文献1に記載の映像検索装置では、入力部から「検索準備」の指示を受けると、映像再生部が媒体の再生を開始し、デコーダがテレビジョン信号をデコードしてクローズドキャプションデータを取得し、メモリに格納する。そして、入力部から「検索要求設定」を受けると、文章検索部においてメモリ内のクローズドキャプションデータを検索し、この検索結果をメモリに保存する。更に、メモリに記録された検索結果を読み出してデコーダへ送り、デコーダでテレビジョン信号に変換して、映像表示部に表示する。これにより、クローズドキャプションの文字情報を利用して映像の内容を容易に検索することができる。
また、この特許文献2に記載の情報処理装置では、テレビジョン放送に重畳されているデータの中から特定分野情報に対応する番組のデータを抽出し、重畳データに含まれる目次ページデータ又は番組内容データからキーワードで特定分野情報に対応する番組のデータを検索する。そして、抽出したデータから、その番組の番組番号及びチャンネルを得て自動的に設定する。これにより、番組番号やチャンネルを指定する操作が不要となる。
また、表示するか否かをユーザが選択することが可能なテキストデータを用いてメタデータを生成する技術も開示されている(例えば、特許文献3を参照。)。この文献記載の情報処理装置においては、放送信号を取得し、この放送信号から番組を固有に区別可能な区別情報を取得する。そして、放送信号に、時刻情報と区別情報とを付加する。これにより、テキストデータに対応する時刻情報と番組を区別する区別情報を有するメタデータを用いて検索することができる。
特開平7−212708号公報(第1頁) 特開平10−327114号公報(第1頁) 特開2005−198206号公報(第1頁)
このような放送字幕の中には外字が利用されている場合がある。例えば、難しい漢字の場合、通常の漢字表記を行なうと返って読み難くなる場合がある。また、電話を表す記号
等、特定の記号を利用することにより内容を簡単に伝達することができる場合もある。また、字幕全体のバランスを考慮して、文字の大きさを調整するために外字を用いる場合もある。
しかし、放送字幕の外字はビットマップであるため、テキストを利用した通常の単語検索を行なうことができない。また、外字を勝手に変換してしまうと、レイアウトが変化し、映像との重なり状態が変わる場合がある。また、フォント生成はプレーヤ側で行なっているため、元の画面を維持させるために放送局側が意図的に外字を用いる場合がある。
本発明は、上記課題を解決するためになされたものであり、その目的は、字幕情報を利用して検索が可能であり、また、携帯電話端末等の表示能力に制限がある端末においても的確な表示を行なうことができる映像情報処理方法、映像情報処理プログラム及び映像情報処理装置を提供することにある。
上記問題点を解決するために、請求項1に記載の発明は、ビットマップデータに対応して文字識別データを記録した文字データ記憶手段と、放送信号から抽出した字幕データを処理する制御手段を含む映像情報処理装置を用いて映像情報処理を行なう方法であって、前記制御手段が、前記放送信号から字幕データを分離する字幕データ分離段階と、前記字幕データに含まれるビットマップデータを用いて前記文字データ記憶手段を検索する検索段階と、前記字幕データ中の前記ビットマップデータを前記文字データ記憶手段から検索された文字で置換するビットマップデータ置換段階とを実行することを要旨とする。
請求項2に記載の発明は、請求項1に記載の映像情報処理方法において、前記置換後の字幕データを含む映像情報ファイルを映像情報記憶手段に記録する段階を更に実行することを要旨とする。
請求項3に記載の発明は、請求項1又は2に記載の映像情報処理方法において、前記制御手段が、前記文字データ記憶手段から前記ビットマップデータに対応する文字を検出できない場合には、オペレータ端末に通知を送信する段階を更に実行することを要旨とする。
請求項4に記載の発明は、請求項2又は3に記載の映像情報処理方法において、前記制御手段が、前記文字データ記憶手段から前記ビットマップデータに対応する文字を検出できない場合には、前記ビットマップデータの特徴を抽出する特徴抽出段階と、前記特徴に基づいて前記文字データ記憶手段を検索する文字検索段階を更に実行し、前記検索を行なった文字に基づいて映像情報ファイルを映像情報記憶手段に記録することを要旨とする。
請求項5に記載の発明は、請求項2〜4のいずれか一つに記載の映像情報処理方法において、前記映像情報処理装置は、単語が登録された辞書データ記憶手段を備え、制御手段が、前記ビットマップデータを変換した文字に対して、前記ビットマップデータの前後において所定数の文字を含めた文字列を生成し、前記生成した文字列について、前記辞書データ記憶手段において単語として登録されているかどうかを検索し、単語を特定できない場合には、前記変換した文字と、前後の文字との間に単語区切りを挿入した映像情報ファイルを映像情報記憶手段に記録することを要旨とする。
請求項6に記載の発明は、ビットマップデータに対応して文字識別データを記録した文字データ記憶手段と、放送信号から抽出した字幕データを処理する制御手段を含む映像情報処理装置を用いて映像情報処理を行なうプログラムであって、前記制御手段を、前記放送信号から字幕データを分離する字幕データ分離手段と、前記字幕データに含まれるビッ
トマップデータを用いて前記文字データ記憶手段を検索する検索手段と、前記字幕データ中の前記ビットマップデータを前記文字データ記憶手段から検索された文字で置換するビットマップデータ置換手段として機能させることを要旨とする。
請求項7に記載の発明は、請求項6に記載の映像情報処理プログラムにおいて、前記置換後の字幕データを含む映像情報ファイルを映像情報記憶手段に記録する手段として更に機能させることを要旨とする。
請求項8に記載の発明は、請求項6又は7に記載の映像情報処理プログラムにおいて、前記制御手段を、前記文字データ記憶手段から前記ビットマップデータに対応する文字を検出できない場合には、オペレータ端末に通知を送信する手段として更に機能させることを要旨とする。
請求項9に記載の発明は、請求項7又は8に記載の映像情報処理プログラムにおいて、前記制御手段を、前記文字データ記憶手段から前記ビットマップデータに対応する文字を検出できない場合には、前記ビットマップデータの特徴を抽出する特徴抽出手段と、前記特徴に基づいて前記文字データ記憶手段を検索する文字検索手段として更に機能させ、前記検索を行なった文字に基づいて映像情報ファイルを映像情報記憶手段に記録することを要旨とする。
請求項10に記載の発明は、請求項7〜9のいずれか一つに記載の映像情報処理プログラムにおいて、前記映像情報処理装置は、単語が登録された辞書データ記憶手段を備え、制御手段が、前記ビットマップデータを変換した文字に対して、前記ビットマップデータの前後において所定数の文字を含めた文字列を生成し、前記生成した文字列について、前記辞書データ記憶手段において単語として登録されているかどうかを検索し、単語を特定できない場合には、前記変換した文字と、前後の文字との間に単語区切りを挿入した映像情報ファイルを映像情報記憶手段に記録することを要旨とする。
請求項11に記載の発明は、ビットマップデータに対応して文字識別データを記録した文字データ記憶手段と、放送信号から抽出した字幕データを処理する制御手段を含む映像情報処理装置であって、前記制御手段が、前記放送信号から字幕データを分離するデコーダと、前記字幕データに含まれるビットマップデータで、前記文字データ記憶手段を検索する検索手段と、前記字幕データ中の前記ビットマップデータを前記文字データ記憶手段から検索された文字で置換するビットマップデータ置換手段を備えたことを要旨とする。
請求項12に記載の発明は、請求項11に記載の映像情報処理装置において、ビットマップデータに対応する文字識別データを入力する文字データ入力手段を更に備えたことを要旨とする。
(作用)
請求項1、6、11に記載の発明によれば、制御手段が放送信号から字幕データを分離し、字幕データに含まれるビットマップデータを用いて文字データ記憶手段を検索する。そして、字幕データ中のビットマップデータを文字データ記憶手段から検索された文字で置換する。これにより、検索ができないビットマップから、検索が可能な文字に変換することができる。また、ビットマップデータの表示が困難な端末においても文字データを表示できる。
請求項2、7に記載の発明によれば、置換後の字幕データを含む映像情報ファイルを映像情報記憶手段に記録する。これにより、文字に変換されたデータを利用者に提供することができる。
請求項3、8に記載の発明によれば、文字データ記憶手段からビットマップデータに対応する文字を検出できない場合には、オペレータ端末に通知を送信するため、オペレータがこのビットマップに対応する文字を登録することができる。
請求項4、9に記載の発明によれば、文字データ記憶手段からビットマップデータに対応する文字を検出できない場合には、ビットマップデータの特徴を抽出し、この特徴に基づいて文字データ記憶手段を検索する。これにより、効率的に置換候補を特定することができる。
請求項5、10に記載の発明によれば、制御手段が、ビットマップデータを変換した文字に対して、ビットマップデータの前後において所定数の文字を含めた文字列を生成する。そして、生成した文字列について、辞書データ記憶手段において単語として登録されているかどうかを検索する。単語としての登録がない場合には、変換した文字と、前後の文字との間に単語区切りを挿入した映像情報ファイルを映像情報記憶手段に記録する。これにより、単語の中の一部に外字が含まれている場合と、独立した外字が含まれている場合とを識別することができる。
請求項12に記載の発明によれば、ビットマップデータに対応する文字識別データを入力する文字データ入力手段を更に備えるため、文字データ記憶手段に置換を行なう文字を蓄積することができる。
本発明によれば、字幕情報を利用して検索が可能であり、また、携帯電話端末等の表示能力に制限がある端末においても的確な表示を行なうことができる。
(第1の実施形態)
以下、本発明を具体化した第1の一実施形態を、図1〜図6を用いて説明する。図1は、本発明を適用した映像情報処理装置の構成について説明するための説明図である。本実施形態では、図1に示すように、放送局からの放送信号を、テレビジョン受像機30を用いて受信する。このテレビジョン受像機30には表示選択字幕デコーダ40、ホームサーバ50が接続される。また、ホームサーバ50は、ネットワークとしてのインターネットIを介して、映像情報処理装置としてのメタデータ作成サーバ70に接続される。このメタデータ作成サーバ70には、文字データ入力手段としてのオペレータ端末(図示せず)に接続されている。
放送局10は、地上波や衛星波などを用いて番組を放送する施設である。放送される番組の放送信号には、映像データと音声データが含まれる。この映像データは、動画像データであり、音声データは、映像データと同期して再生される音声に関するデータである。
また、この放送信号の中には、映像として常に表示される字幕と、選択により表示される字幕とが含まれる。前者には、番組の題名やキャストなどの紹介、海外の作品における日本語字幕等がある。一方、後者のように表示選択の可能な字幕データ(いわゆるクローズドキャプション)には、出演者の会話に対応するテキストデータや、例えばBGMや効果音など、放送コンテンツに関する説明が含まれている場合もある。このように、表示と非表示を選択可能な字幕データを「表示選択字幕データ」と呼ぶ。
次に、この表示選択字幕データについて説明する。例えばNTSC方式のアナログの地上波放送では、映像信号に525本の走査線が用いられている。この525本のうち、各
フィールド(2フィールドで1フレームを構成)の最初の21本相当は、VBI(Vertical Blanking Interval:垂直帰線消去期間)と呼ばれ、走査を開始するためのインターバル用に割り当てられている。クローズドキャプションは、各フィールドのVBIのうち、VBIの21本目に7bitの文字コードを多重化することによって伝送されるように構成されている。そして、各フィールドを使って2種類の文字セットを約60文字/秒で伝送することができる。この表示選択字幕データは、再生時に映像データからデコードされて、映像と同時に表示させることができる。
ユーザは、テレビジョン受像機30を用いて、表示選択字幕データを含む映像データ及び音声データで構成される放送信号を受信する。このテレビジョン受像機30は、チューナ31、信号処理部32、ディスプレイやスピーカからなる出力部33を備える。表示選択字幕データを表示させない場合には、チューナ31によって選局された放送信号を信号処理部32において復調し、出力部33において、映像信号はディスプレイに出力し、音声信号はスピーカに出力して番組を視聴することができる。
このテレビジョン受像機30は、チューナ31によって選局された放送信号を取得する。そして、表示選択字幕デコーダ40は、テレビジョン受像機30のチューナ31によって選局された放送信号を取得し、映像信号および音声信号をデコードする。そして、ユーザの操作入力に基づいて、表示選択字幕データを抽出、デコードし、出力部33への出力を行なう。
更に、表示選択字幕デコーダ40は、ホームサーバ50がインターネットIを介してメタデータ作成サーバ70から取得したメタデータを用いて検索や要約処理を実行する。
ホームサーバ50は、ユーザの操作入力に基づいて、表示選択字幕デコーダ40により生成されたタイムスタンプつき録画データの供給を受けて、内部のデータ記憶手段に記録する。
また、ホームサーバ50は、インターネットIを介して、メタデータ作成サーバ70から、表示選択字幕データに対応するテキストデータと、テキストデータに対応するタイムコードにより構成される暗号化メタデータの供給を受ける。更に、暗号化メタデータを、鍵データを利用して復号化し、このメタデータを用いてユーザが入力したテキストとメタデータとのマッチング処理を実行することができる。そして、マッチング処理の結果、ユーザが入力したテキストに対応するタイムコードを検出した場合には、タイムコードに基づいて録画データを検索し、表示選択字幕デコーダ40に供給する。
メタデータ作成サーバ70は、各種ネットワークや電波を介して受信することにより、放送局10が作成した表示選択字幕データ付きの放送信号を取得する。そして、この放送信号を用いてメタデータを作成する。そして、作成したメタデータを暗号化する。また、メタデータ作成サーバ70は、暗号化されたメタデータを、インターネットIを介してユーザに配布する。このメタデータ作成サーバ70は、制御手段としてのCPU(Central Processing Unit )からなる制御手段、ROM(Read Only Memory)やRAM(Random Access Memory )、HDD(Hard Disk Drive )等のデータ記憶手段を備える。メタデータ作成サーバ70のブロック構成を図3に示す。メタデータ作成サーバ70のCPUは、映像情報処理プログラムを実行することによって、字幕データ分離段階、検索段階、ビットマップデータ置換段階、映像情報記憶手段に記録する段階、オペレータ端末に通知を送信する段階等を実行する。この結果、メタデータ作成サーバ70は、以下の機能ブロック図に示す機能を実現する。
信号取得手段としての放送信号取得部701は、ネットワークや放送電波を介して放送信号を取得してデコーダ702に供給する。デコーダ702は、放送信号取得部701か
ら供給された放送信号をデコードする。ここで、デコーダ702は、放送信号のうち、メタデータの作成に必要となる番組ID情報を含む番組管理情報や表示選択字幕データが含まれている映像信号のみをデコードする。
番組ID情報抽出部703は、デコーダ702によりデコードされた映像データに含まれる番組管理データから、放送番組を特定することができる番組ID情報を抽出し、メタデータ生成部708に供給する。更に、番組ID情報抽出部703は、この映像データを、分離手段としての表示選択字幕データデコーダ704に供給する。
そして、表示選択字幕データデコーダ704と解析処理部705とが外字処理を実行する。この処理を、図4を用いて説明する。
この処理は、文字データ記憶手段としての外字データ記憶部71を用いて行なわれる。この外字データ記憶部71にはビットマップデータに対応した文字を特定する文字識別データ、すなわちビットマップに対応したテキストデータが関連付けられた変換表データが記録されている。例えば、電話の形をした絵文字(ビットマップ)に対しては、テキストとして「電話」が記録される。また、難しい漢字に対して略した絵文字に対しても、テキストとして本来の文字が記録される。本実施形態では、この変換表データは、オペレータがビットマップデータに対応してテキストデータの登録を行なった場合に記録される。
まず、字幕データ分離手段としての表示選択字幕データデコーダ704は、取得した映像データに含まれる表示選択字幕データをデコードする字幕データ読込処理を実行する手段として機能する。この場合、表示選択字幕データは8単位符号によって構成されているため、表示選択字幕データデコーダ704は、8単位符号に対応するテキストを特定するテキストデータに変換する(ステップS1−1)。ここで、8単位符号に対応するテキストがない場合には、外字データとして、8単位符号のままで解析処理部705に供給する。
この解析処理部705は、文字データ記憶手段を検索する検索手段、ビットマップデータ置換手段及びオペレータ端末に通知を送信する手段として機能する。
まず、解析処理部705は、表示選択字幕データデコーダ704によって変換されたデータに、外字データが含まれるかどうかを確認する(ステップS1−2)。具体的には、8単位符号にビットマップデータからなる外字が含まれているかどうかを調べる。外字データが含まれる場合(ステップS1−2において「YES」の場合)、解析処理部705は、検出したビットマップを用いて外字データ記憶部71に記録された外字表を検索する(ステップS1−3)。
外字表においてビットマップに対応するテキストの登録がある場合(ステップS1−4において「YES」の場合)には、解析処理部705は、外字変換を行なう(ステップS1−5)。具体的には、この外字のビットマップデータを外字表に記録されたテキストに置換する。
一方、ビットマップデータの登録がない場合(ステップS1−4において「NO」の場合)には、解析処理部705は、オペレータ通知を行なう(ステップS1−6)。具体的には、解析処理部705は、オペレータ端末に、外字データ記憶部71に記録がない外字を検出したことを通知し、外字データの登録指示を行なう。
一方、外字データが含まれない場合(ステップS1−2において「NO」の場合)、解析処理部705は、ステップS1−3〜S1−6の処理をスキップする。この場合には、表示選択字幕データデコーダ704によって、変換されたテキストデータをそのまま用いる。
そして、解析処理部705は、テキスト変換されたデータと外字変換されたデータとを結合して字幕メタデータを生成する(ステップS1−7)。
そして、図3に示すようにタイムコード付加処理部707は、解析処理部705から字幕データの登録指示を受ける。タイムコード付加処理部707は、タイマ706を用いて、字幕データの登録指示を受けた時刻をタイムコードとして付加する。例えば、表示選択字幕に対応するテキストの場合には、表示選択字幕の開始時刻に対応するタイムコードが付加される。放送信号取得部701が、放送に対してリアルタイムで放送信号を取得した場合、タイムコード付加処理部707はタイマ706が示す現在時刻に基づいて、タイムコードをテキストデータに付加するものとする。また、番組放送時刻に対してタイムコード付加時刻に遅れがある場合には、タイムコード付加処理部707は、この遅延時間とタイマ706が示す現在時刻とに基づいて、番組の放送時刻に対応するタイムコードを算出し、テキストデータに付加する。
メタデータ生成部708は、タイムコード付加処理部707から供給されたタイムコードが付加されたテキストデータに、番組ID情報抽出部703から供給された番組ID情報を付加してメタデータを生成する。このメタデータは、図2に示すように、テキストデータに対して、テキスト群の開始時刻が記載されたタイムコードが付加される。そして、番組ID情報抽出部703から供給された番組ID情報が付加される。そして、このメタデータは暗号化処理部709に供給される。
暗号化処理部709は、メタデータ生成部708から供給されたメタデータを、鍵データ記憶部72に予め記憶されている暗号化鍵で暗号化する。鍵データ記憶部72には、番組ID毎に暗号化鍵が記録されている。そして、暗号化処理部709は、メタデータに含まれる番組IDに基づいて、鍵データ記憶部72から暗号化鍵を抽出し、この暗号化鍵を用いてメタデータの暗号化を行なうとともに、暗号化メタデータ記憶部73に記録する。暗号化メタデータ記憶部73は、検索を行なった文字に基づいて映像情報ファイルを記録する映像情報記憶手段として機能する。この暗号化メタデータは、ユーザからの要求に応じて、番組毎に、送信手段としての通信部710からインターネットIを介してホームサーバ50に提供される。
次に、表示選択字幕デコーダ40と、ホームサーバ50との構成を説明する。先ず、表示選択字幕デコーダ40のブロック構成図を図5に示す。
テレビジョン受像機30のチューナ31により選局された放送信号のうち、表示選択字幕データを含む映像信号、音声信号は、それぞれ所定の入力端子より、映像信号デコーダ401、音声信号デコーダ402に入力される。
映像信号デコーダ401は、供給された映像信号をデコードし、デコードされた映像データをメモリ403に供給する。メモリ403は、供給された映像信号を一時保持するフレームメモリである。音声信号デコーダ402は、供給された音声信号をデコードし、デコードされた音声データを出力する。
受信された放送信号をリアルタイムに出力する場合、表示選択字幕データデコーダ405は、メモリ403から映像データを取得する。そして、表示選択字幕データの表示が指示された場合、表示選択字幕データデコーダ405は、取得した映像データに含まれる表示選択字幕データをデコードして、対応するテキストデータをOSD(On Screen Display )406に供給するとともに、映像データを合成処理部407に供給する。
OSD406は、供給されたテキストデータを、表示画面に重畳して表示させるための画像データであるOSDデータに変換して、合成処理部407に供給する。合成処理部4
07は、供給された映像データに、供給されたOSDデータを重畳して、出力端子からテレビジョン受像機30の出力部33のディスプレイに出力する。また、音声処理部408は、音声信号デコーダ402によりデコードされた音声データを取得して、テレビジョン受像機30の出力部33のスピーカに出力する。
次に、映像信号および音声信号をホームサーバ50に出力して録画させる場合、出力信号生成部409は、番組ID抽出部410に、メモリ403に保持されている映像データから番組管理データに含まれる番組IDを抽出させる。
出力信号生成部409は、タイマ411を参照して、録画が開始された時刻(絶対時刻)を取得し、メモリ403から供給される映像データ、又は音声信号デコーダ402から供給される音声データのうちの少なくともいずれか一方に、取得した時刻情報を付加する。更に、映像データおよび音声データに対して、番組ID抽出部410から供給された番組IDを付加して、録画のための出力信号を生成してホームサーバ50に供給する。ここで付加された時刻情報は、タイムスタンプとして、後述する検索や抽出処理において用いられる。
このような処理により、表示選択字幕デコーダ40は、ユーザの操作入力に基づいて、表示選択字幕をデコードして映像に重畳させて表示させたり、録画データを生成し、ホームサーバ50に供給して録画させたりすることが可能となる。
次に、図6に示すホームサーバ50のブロック構成図を説明する。
操作入力部501は、例えば、ボタン、キー、タッチパネル、タッチパッド、レバーなどの入力デバイスで構成され、ユーザの操作入力を受ける。録画データ記憶部52には、表示選択字幕デコーダ40から供給される番組ID及びタイムスタンプが付加された映像データおよび音声データを記憶する。録画データ記憶部52は、例えば、ハードディスクなどの大容量記録媒体により構成されるようにしても、DVD(Digital Versatile Disk)や磁気テープなどのリムーバブルな記録媒体を用いることも可能である。
録画制御部502は、操作入力部501から放送番組の録画指示が入力された場合、表示選択字幕デコーダ40の出力信号生成部409に対して映像信号や音声信号の出力を指示する。
ネットワークIF部503は、インターネットIを介して通信を行なうインターフェースである。ここでは、メタデータ作成サーバ70との間でデータの送受信を行なう。
表示部504は、例えば、LCD(Liquid Crystal Display)またはCRT(Cathode Ray Tube)などで構成され、各種情報を表示する。
暗号化メタデータ記憶部53は、メタデータ作成サーバ70から取得した暗号化メタデータを記憶する。
鍵データ記憶部54は、暗号化メタデータを復号化するために、予め復号化鍵を記憶する。この復号化鍵は番組ID毎に提供され、記録される。
復号処理部505は、暗号化メタデータ記憶部53に記録されている暗号化メタデータを、鍵データ記憶部54に記憶されている復号化鍵を用いて復号し、映像情報記憶手段としてのメタデータ記憶部55に記録する。
操作入力部501に、検索対象の番組IDと、検索キーとなるテキストが入力された場合、マッチング処理部506は、メタデータ記憶部55に記録されているメタデータを参照して、マッチング処理を実行する。そして、検索キーを含むテキストを特定した場合、
このテキストに関連付けられたタイムコードを録画データ検索処理部507に供給する。
ここで、操作入力部501において番組IDのみが指定されている場合、マッチング処理部506は、この番組IDに関連付けられて記録されたメタデータをメタデータ記憶部55から抽出する。そして、このメタデータに含まれるタイムコードと番組IDは、録画データ記憶部52を検索するために用いられる。このため、抽出したタイムコードを録画データ検索処理部507に供給する。
録画データ検索処理部507は、マッチング処理部506から供給されたマッチング結果(番組IDとタイムコード)に基づいて録画データ記憶部52を検索する。そして、この番組IDの付与された録画において、タイムコードにより特定された画像を表示選択字幕デコーダ40に供給する。
以上、本実施形態によれば、以下に示す効果を得ることができる。
・ 上記実施形態では、字幕データに外字データが含まれる場合、解析処理部705は、検出したビットマップを用いて外字データ記憶部71に記録された外字表を検索する(ステップS1−3)。これにより、通常のテキストデータを用いて検索を行なうことができる。そして、このメタデータにはタイムコードが付加されているので、検索によって特定したタイムコードを用いて画像を抽出することができる。また、携帯電話端末等においては表示能力に制限があるため、ビットマップデータ等を表示できない場合がある。このような端末においても、通常のテキストデータを用いているので、的確な表示を行なうことができる。
・ 上記実施形態では、外字表にビットマップの登録がない場合には、解析処理部705は、オペレータ通知を行なう(ステップS1−6)。これにより、オペレータは、ビットマップデータに対応した文字識別データについて新たな外字登録を行なうことができる。この結果、同じ外字が出現した場合には、外字データ記憶部71を用いて変換することができる。
(第2の実施形態)
次に、本発明を具体化した第2の実施形態を、図7を用いて説明する。なお、第2の実施形態は、第1の実施形態の外字処理を変更した構成であるため、同様の部分についてはその詳細な説明を省略する。本実施形態の映像情報処理装置の解析処理部705は、ビットマップデータの特徴を抽出する特徴抽出手段と、この特徴に基づいて外字データ記憶部71を検索する文字検索手段として機能する。そして、これらの手段を利用して、図7に示す処理手順を実行する。
本実施形態では、図7に示すように、外字表においてビットマップに対応するテキストの登録がある場合(ステップS1−4において「YES」の場合)には、解析処理部705は、画像認識を行なう(ステップS2−1)。具体的には、解析処理部705は、ビットマップの画像認識を行ない、この画像と特徴点が一致する文字を、外字データ記憶部71において特定する。そして、解析処理部705は、この文字を変換候補として、オペレータ通知を行なう(ステップS1−6)とともに、オペレータの確認があるまでは、この文字を用いる。
以上、本実施形態によれば、第1の実施形態の効果に加え、以下に示す効果を得ることができる。
・ 上記実施形態では、解析処理部705がビットマップの画像認識を行なうため、効率的に外字変換を行なうことができる。そして、オペレータの作業負荷を軽減することができる。
(第3の実施形態)
次に、本発明を具体化した第3の実施形態を、図8を用いて説明する。なお、第3の実施形態は、第2の実施形態の外字処理を変更した構成であるため、同様の部分についてはその詳細な説明を省略する。本実施形態の映像情報処理装置は、通常、単語として利用される文字列が登録された辞書データ記憶手段を備える。そして、この辞書データ記憶手段を利用して、図8に示す処理手順を実行する。
本実施形態では、図8に示すように、外字変換を行なった場合(ステップS1−5)、解析処理部705は、辞書データ記憶手段を用いて隣接文字を含めて辞書検索を行なう(ステップS3−1)。この外字変換には、外字データ記憶部を用いて変換した場合(ステップS1−5)や画像認識を行なった場合(ステップS2−1)がある。また、隣接文字の範囲は、予め定められた文字数の範囲内で文字数を変更して、繰り返し辞書検索が行なわれる。
そして、辞書検索に隣接文字を含めた単語が辞書データ記憶手段に登録されている場合には(ステップS3−2において「YES」の場合)には、解析処理部705は、単語区切りとしてのスペースを挿入して字幕を生成する(ステップS3−3)。
以上、本実施形態によれば、第2の実施形態の効果に加え、以下に示す効果を得ることができる。
・ 上記実施形態では、辞書登録がある場合、解析処理部705が、単語区切りとしてのスペースを挿入するため、前後の文字と結合させて意味がある単語を登録することができる。また、外字一文字で意味がある場合には、単独で登録することができる。
なお、上記実施形態は、以下の態様に変更してもよい。
○ 上記実施形態では、メタデータ作成サーバ70の解析処理部705が外字処理を行なった。外字処理を実行するハードウエアはこれに限定されるものではなく、放送受信者側、例えばホームサーバ50に、外字処理を行なう解析処理部を設けてもよい。
○ 上記実施形態では、解析処理部705は画像認識を行ない(ステップS2−1)、オペレータ通知を行なう(ステップS1−6)。これに代えて、画像認識の一致率に応じてオペレータ通知の要否を変更してもよい。具体的には、画像認識の一致率についてオペレータ通知基準値を設け、一致率がオペレータ通知基準値以下の場合にのみ、オペレータ通知を行なう。これにより、オペレータの負荷を軽減することができる。
○ 上記実施形態では、メタデータに基づいて画像を特定するポインタ情報としてタイムコードを用いたが、これに限られるものはではなく、画面毎に割り振られたフレームデータを用いることも可能である。この場合、映像情報処理装置はフレームカウンタを備え、メタデータを記録する場合には、ポインタ情報としてフレームデータを用いる。そして、ダイジェストを作成したり、録画を再生したりする場合には、このフレームデータを用いて、画像や再生開始位置を特定することができる。この場合には、タイムコードにおける時刻のずれの影響をなくすことができる。
○ 上記実施形態では、外字を変換したテキストデータを含むメタデータを提供したが、外字をそのまま利用した準オリジナルファイル、テキスト変換した検索用ファイル、テキスト変換した表示ファイルを、利用者の要求に応じて組み合わせて提供してもよい。
本発明の一実施形態のシステム概略図。 本発明の一実施形態のメタデータの説明図。 本発明の実施形態の処理手順の説明図。 本発明の一実施形態のメタデータ作成サーバのブロック構成の説明図。 本発明の一実施形態の表示選択字幕デコーダの説明図。 本発明の一実施形態のホームサーバの説明図。 本発明の他の実施形態の処理手順の説明図。 本発明の他の実施形態の処理手順の説明図。
符号の説明
10…放送局、30…録画装置、40…表示字幕デコーダ、50…ホームサーバ、70…映像情報処理装置としてのメタデータ作成サーバ、701…放送信号取得部、702…デコーダ、704…表示選択字幕データデコーダ、55…メタデータ記憶部、705…解析処理部、I…ネットワークとしてのインターネット。

Claims (12)

  1. ビットマップデータに対応して文字識別データを記録した文字データ記憶手段と、
    放送信号から抽出した字幕データを処理する制御手段を含む映像情報処理装置を用いて映像情報処理を行なう方法であって、
    前記制御手段が、
    前記放送信号から字幕データを分離する字幕データ分離段階と、
    前記字幕データに含まれるビットマップデータを用いて前記文字データ記憶手段を検索する検索段階と、
    前記字幕データ中の前記ビットマップデータを前記文字データ記憶手段から検索された文字で置換するビットマップデータ置換段階と
    を実行することを特徴とする映像情報処理方法。
  2. 前記置換後の字幕データを含む映像情報ファイルを映像情報記憶手段に記録する段階を更に実行することを特徴とする請求項1に記載の映像情報処理方法。
  3. 前記制御手段が、前記文字データ記憶手段から前記ビットマップデータに対応する文字を検出できない場合には、オペレータ端末に通知を送信する段階を更に実行することを特徴とする請求項1又は2に記載の映像情報処理方法。
  4. 前記制御手段が、前記文字データ記憶手段から前記ビットマップデータに対応する文字を検出できない場合には、前記ビットマップデータの特徴を抽出する特徴抽出段階と、
    前記特徴に基づいて前記文字データ記憶手段を検索する文字検索段階を更に実行し、
    前記検索を行なった文字に基づいて映像情報ファイルを映像情報記憶手段に記録することを特徴とする請求項2又は3に記載の映像情報処理方法。
  5. 前記映像情報処理装置は、単語が登録された辞書データ記憶手段を備え、
    制御手段が、前記ビットマップデータを変換した文字に対して、前記ビットマップデータの前後において所定数の文字を含めた文字列を生成し、
    前記生成した文字列について、前記辞書データ記憶手段において単語として登録されているかどうかを検索し、単語を特定できない場合には、前記変換した文字と、前後の文字との間に単語区切りを挿入した映像情報ファイルを映像情報記憶手段に記録することを特徴とする請求項2〜4のいずれか一つに記載の映像情報処理方法。
  6. ビットマップデータに対応して文字識別データを記録した文字データ記憶手段と、
    放送信号から抽出した字幕データを処理する制御手段を含む映像情報処理装置を用いて映像情報処理を行なうプログラムであって、
    前記制御手段を、
    前記放送信号から字幕データを分離する字幕データ分離手段と、
    前記字幕データに含まれるビットマップデータを用いて前記文字データ記憶手段を検索する検索手段と、
    前記字幕データ中の前記ビットマップデータを前記文字データ記憶手段から検索された文字で置換するビットマップデータ置換手段
    として機能させることを特徴とする映像情報処理プログラム。
  7. 前記置換後の字幕データを含む映像情報ファイルを映像情報記憶手段に記録する手段として更に機能させることを特徴とする請求項6に記載の映像情報処理プログラム。
  8. 前記制御手段を、前記文字データ記憶手段から前記ビットマップデータに対応する文字を検出できない場合には、オペレータ端末に通知を送信する手段として更に機能させるこ
    とを特徴とする請求項6又は7に記載の映像情報処理プログラム。
  9. 前記制御手段を、
    前記文字データ記憶手段から前記ビットマップデータに対応する文字を検出できない場合には、前記ビットマップデータの特徴を抽出する特徴抽出手段と、
    前記特徴に基づいて前記文字データ記憶手段を検索する文字検索手段として更に機能させ、
    前記検索を行なった文字に基づいて映像情報ファイルを映像情報記憶手段に記録することを特徴とする請求項7又は8に記載の映像情報処理プログラム。
  10. 前記映像情報処理装置は、単語が登録された辞書データ記憶手段を備え、
    制御手段が、前記ビットマップデータを変換した文字に対して、前記ビットマップデータの前後において所定数の文字を含めた文字列を生成し、
    前記生成した文字列について、前記辞書データ記憶手段において単語として登録されているかどうかを検索し、単語を特定できない場合には、前記変換した文字と、前後の文字との間に単語区切りを挿入した映像情報ファイルを映像情報記憶手段に記録することを特徴とする請求項7〜9のいずれか一つに記載の映像情報処理プログラム。
  11. ビットマップデータに対応して文字識別データを記録した文字データ記憶手段と、
    放送信号から抽出した字幕データを処理する制御手段を含む映像情報処理装置であって、
    前記制御手段が、
    前記放送信号から字幕データを分離するデコーダと、
    前記字幕データに含まれるビットマップデータで、前記文字データ記憶手段を検索する検索手段と、
    前記字幕データ中の前記ビットマップデータを前記文字データ記憶手段から検索された文字で置換するビットマップデータ置換手段
    を備えたことを特徴とする映像情報処理装置。
  12. ビットマップデータに対応する文字識別データを入力する文字データ入力手段を更に備えたことを特徴とする請求項11に記載の映像情報処理装置。
JP2005368700A 2005-12-21 2005-12-21 映像情報処理方法、映像情報処理プログラム及び映像情報処理装置 Pending JP2007174246A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005368700A JP2007174246A (ja) 2005-12-21 2005-12-21 映像情報処理方法、映像情報処理プログラム及び映像情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005368700A JP2007174246A (ja) 2005-12-21 2005-12-21 映像情報処理方法、映像情報処理プログラム及び映像情報処理装置

Publications (1)

Publication Number Publication Date
JP2007174246A true JP2007174246A (ja) 2007-07-05

Family

ID=38300226

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005368700A Pending JP2007174246A (ja) 2005-12-21 2005-12-21 映像情報処理方法、映像情報処理プログラム及び映像情報処理装置

Country Status (1)

Country Link
JP (1) JP2007174246A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009095020A (ja) * 2007-10-04 2009-04-30 Smsc Europe Gmbh 通信システムを通じてリアルタイム同期するためのシステム及び方法
JP2010245887A (ja) * 2009-04-07 2010-10-28 Toshiba Corp 情報処理装置および字幕文データ変換方法
JP2012235526A (ja) * 2012-08-02 2012-11-29 Toshiba Corp 情報処理装置および動画像データの送信方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009095020A (ja) * 2007-10-04 2009-04-30 Smsc Europe Gmbh 通信システムを通じてリアルタイム同期するためのシステム及び方法
JP2010245887A (ja) * 2009-04-07 2010-10-28 Toshiba Corp 情報処理装置および字幕文データ変換方法
JP2012235526A (ja) * 2012-08-02 2012-11-29 Toshiba Corp 情報処理装置および動画像データの送信方法

Similar Documents

Publication Publication Date Title
US9942599B2 (en) Methods and apparatus to synchronize second screen content with audio/video programming using closed captioning data
CN103354623A (zh) 网络终端系统以及终端装置
JP2012135023A (ja) カスタマイズされたマルチメディア・セグメントを作成しかつ視聴するための方法と装置
JP4019085B2 (ja) 番組録画装置、番組録画方法および番組録画プログラム
KR20080108700A (ko) 방송 수신기에서 인터넷 tv 정보를 제공하는 방법 및 그방법을 채용한 방송 수신기
JP4525711B2 (ja) 番組情報処理装置及び番組情報処理方法
US8332891B2 (en) Information processing apparatus and method, and program
JP5202217B2 (ja) 放送コンテンツから時事性のあるキーワードを抽出する放送受信装置及びプログラム
EP2124443A1 (en) Program data management server, identifier allocation device, program data management method and computer program
JPH1169317A (ja) 情報再生装置および放送番組関連情報再生方法
JP2008227909A (ja) 映像検索装置
RU2316134C2 (ru) Устройство и способ для обработки текстов в приемнике цифрового вещания
JP4799662B2 (ja) 放送受信装置及び放送受信方法
JP5209129B1 (ja) 情報処理装置、放送受信装置及び情報処理方法
JP2007174246A (ja) 映像情報処理方法、映像情報処理プログラム及び映像情報処理装置
KR100807101B1 (ko) 디지털 영상 장치에 저장된 영상 데이터의 정보 제공 장치,방법 및 이를 구현하기 위한 프로그램을 기록한 기록매체
JP2005303742A (ja) 情報処理装置および情報処理方法、プログラム、並びに、情報処理システム
JP2005303743A (ja) 情報処理装置および情報処理方法、プログラム、並びに、情報処理システム
JP3569441B2 (ja) 類似番組検索装置、類似番組検索方法および類似番組検索プログラムを記録した媒体
JP5156508B2 (ja) デジタル放送受信装置
JP4353198B2 (ja) 字幕データ処理方法、字幕データ処理プログラム及び字幕データ処理装置
JP5703321B2 (ja) 情報処理装置及び情報処理方法
JP3833670B2 (ja) 情報処理装置および情報処理方法、プログラム、並びに、情報処理システム
JP5156527B2 (ja) 番組再生装置
JP2007060222A (ja) 映像処理装置、映像処理方法及び映像処理プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081021

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081222

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090609