JP4320001B2 - 字幕生成プログラムおよび字幕生成装置 - Google Patents

字幕生成プログラムおよび字幕生成装置 Download PDF

Info

Publication number
JP4320001B2
JP4320001B2 JP2005123493A JP2005123493A JP4320001B2 JP 4320001 B2 JP4320001 B2 JP 4320001B2 JP 2005123493 A JP2005123493 A JP 2005123493A JP 2005123493 A JP2005123493 A JP 2005123493A JP 4320001 B2 JP4320001 B2 JP 4320001B2
Authority
JP
Japan
Prior art keywords
message
video
caption
subtitle
video content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005123493A
Other languages
English (en)
Other versions
JP2006303959A (ja
Inventor
英一 渡辺
理恵 衣笠
充彦 山本
大偉治 山野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005123493A priority Critical patent/JP4320001B2/ja
Publication of JP2006303959A publication Critical patent/JP2006303959A/ja
Application granted granted Critical
Publication of JP4320001B2 publication Critical patent/JP4320001B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、字幕情報を生成する字幕生成プログラムおよび字幕生成装置に関し、特に、映像に対応した字幕をリアルタイムに生成することができ、オペレータの人件費や訓練費が少なくて済む字幕生成プログラムおよび字幕生成装置に関するものである。
映像と連動させて字幕(テロップ)を表示する手法は、映像の内容を補足したり、映像の臨場感を高めたりする目的において非常に有効な手法である。映像と連動させて字幕を表示する方式には、予め字幕の内容と表示タイミングとをデータベース等に登録しておく方式と、映像に合わせて字幕を動的に入力していく方式とがある。
前者の方式を実現するための技術は、たとえば、特許文献1において開示されている。また、後者の方式を実現するための技術は、たとえば、特許文献2において開示されている。具体的には、特許文献1においては、ビデオデータに対応した電子文書を予め用意しておき、この電子文書に基づいて字幕を表示する技術が開示されている。また、特許文献2においては、字幕の入力を複数の端末で分担することにより、字幕の表示が映像の表示よりも遅れることを回避する技術が開示されている。
特開2001−160064号公報 特開2004−72705号公報
しかしながら、特許文献1のように字幕の内容と表示タイミングを事前に登録しておく方式は、テレビのニュース番組やスポーツ中継のように映像の内容が確定していない生番組等には対応することができない。また、特許文献2のように映像に合わせて字幕を動的に入力していく方式は、生番組等への対応は可能だが、入力を担当するオペレータの人件費や訓練費などのコストが高くつく。
この発明は、上述した従来技術による問題点を解消するためになされたものであり、映像に対応した字幕をリアルタイムに生成することができ、オペレータの人件費や訓練費を低く抑えることができる字幕生成プログラムおよび字幕生成装置を提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明は、字幕情報を生成する字幕生成プログラムであって、入力された映像を解析する解析手順と、前記解析手順の解析結果と予め記憶手段に格納されたキーワードとを照合して映像の内容を特定する特定手順と、映像の内容と関連付けて記憶手段に格納されたメッセージから前記特定手順が特定した内容に対応するメッセージを選択する選択手順とをコンピュータに実行させることを特徴とする。
また、本発明は、字幕情報を生成する字幕生成装置であって、入力された映像を解析する解析手段と、前記解析手段の解析結果と予め記憶手段に格納されたキーワードとを照合して映像の内容を特定する特定手段と、映像の内容と関連付けて記憶手段に格納されたメッセージから前記特定手段が特定した内容に対応するメッセージを選択する選択手段とを備えたことを特徴とする。
この発明によれば、映像の内容を特定するためのキーワードと映像の内容に対応するメッセージとを記憶手段に格納しておき、入力される映像を逐次解析してその結果と記憶手段に格納されたキーワードとを照合して映像の内容を特定し、特定した内容と対応するメッセージを逐次出力するように構成したので、テレビの生放送のように内容が確定していない映像に対応してリアルタイムで字幕情報を生成することができる。
また、字幕の生成時に訓練された複数のオペレータを必要としないので、高い人件費や訓練費を必要とせず、低コストで字幕のリアルタイム生成を実現することができる。
また、本発明は、上記の発明において、前記解析手段は、映像に含まれる音声を解析することを特徴とする。
この発明によれば、映像に含まれる音声によって映像を解析するように構成したので、画像による内容の特定が困難な映像にも適用することができる。
また、本発明は、上記の発明において、前記解析手段は、映像に含まれる画像を解析することを特徴とする。
この発明によれば、映像に含まれる画像によって映像を解析するように構成したので、音声による内容の特定が困難な映像にも適用することができる。
また、本発明は、上記の発明において、字幕情報の生成をおこなっている最中に前記記憶手段にメッセージを登録することが可能なメッセージ登録手順をさらにコンピュータに実行させることを特徴とする。
この発明によれば、映像の内容と対応したメッセージを字幕情報の生成中においても登録できるように構成したので、視聴者の反応をメッセージに動的に反映させて、映像の臨場感を一層高めることができる。
本発明によれば、映像の内容を特定するためのキーワードと映像の内容に対応するメッセージとを記憶手段に格納しておき、入力される映像を逐次解析してその結果と記憶手段に格納されたキーワードとを照合して映像の内容を特定し、特定した内容と対応するメッセージを逐次出力するように構成したので、テレビの生放送のように内容が確定していない映像に対応してリアルタイムで字幕情報を生成することができるという効果を奏する。
また、字幕の生成時に訓練された複数のオペレータを必要としないので、高い人件費や訓練費を必要とせず、低コストで字幕のリアルタイム生成を実現することができるという効果を奏する。
また、本発明によれば、映像に含まれる音声によって映像を解析するように構成したので、画像による内容の特定が困難な映像にも適用することができるという効果を奏する。
また、本発明によれば、映像に含まれる画像によって映像を解析するように構成したので、音声による内容の特定が困難な映像にも適用することができるという効果を奏する。
また、本発明によれば、映像の内容と対応したメッセージを字幕情報の生成中においても登録できるように構成したので、視聴者の反応をメッセージに動的に反映させて、映像の臨場感を一層高めることができるという効果を奏する。
以下に添付図面を参照して、本発明に係る字幕生成プログラムおよび字幕生成装置の好適な実施の形態を詳細に説明する。なお、以下の実施例では、本発明に係る字幕生成プログラムおよび字幕生成装置を野球中継における応援メッセージの表示に適用した例について説明をおこなうが、本発明に係る字幕生成プログラムおよび字幕生成装置の適用対象はこれに限定されるものではない。
本実施例では、本発明に係る字幕生成プログラムおよび字幕生成装置を野球中継における応援メッセージの表示に適用した場合を例にして説明をおこなう。まず、本実施例に係る字幕生成装置の構成について説明する。図1は、本実施例に係る字幕生成装置の構成を示す機能ブロック図である。
同図に示すように、字幕生成装置100は、映像入力装置200と、データ方法装置300と、字幕合成装置400と接続された構成をとる。映像入力装置200は、字幕生成装置100に映像を入力する装置であり、ビデオカメラやビデオ再生装置などがこれに相当する。本実施例では、字幕生成装置100は、映像入力装置200から野球中継の映像が入力されるものとする。なお、本実施例においては、特に断りがない場合、映像という語は、画像の他に音声も含むものを表すこととする。
データ放送装置300は、受信端末との間で双方向のサービスを実現するための装置である。近年サービスが開始されたデジタル放送においては、放送電波の一部をもちいてBML(Broadcast Markup Language)と呼ばれるフォーマットの電子画面データを受信端末に配信し、必要があれば、通信回線を通じて受信端末とサーバ装置との間でデータ通信をおこなうデータ放送サービスが実現されている。本実施例では、字幕生成装置100は、データ放送装置300を通じて視聴者から野球選手への応援メッセージが入力されるものとする。
字幕合成装置400は、映像に字幕を重畳するための装置である。字幕生成装置100から出力された字幕情報は、字幕合成装置400によって映像に字幕として重畳され、放送設備へ送られる。本実施例では、字幕生成装置100は、野球中継の映像を基にして字幕情報を出力し、字幕合成装置400が野球中継の映像と字幕情報を重畳して出力する構成となる。
字幕生成装置100は、入力された映像から字幕情報を出力する装置であり、制御部110と、記憶部120とを有する。制御部110は、字幕生成装置100を全体制御する制御部であり、映像解析部111と、認識対象特定部112と、メッセージ選択部113と、メッセージ出力部114と、メッセージ登録部115とを有する。
映像解析部111は、映像に含まれる画像や音声を解析し、解析結果を文字情報として出力する処理部である。本実施例では、映像に映し出されている野球選手を特定するために、画像を解析してユニフォームの背番号、チーム名、選手名等を文字情報として出力し、また、音声を解析してアナウンサーの発した語を文字情報として出力する。もちろん、選手の顔や体型を解析対象としてもよい。なお、画像や音声の解析方式については、本発明では特定しないものとする。
認識対象特定部112は、映像解析部111が出力した文字情報と記憶部120のキーワードデータベース121に予め格納されたキーワードとを照合して、映像に含まれているはずのものを認識対象として特定する処理部である。本実施例においては、キーワードデータベース121に野球選手の選手名やチーム名、背番号等がキーワードとして格納され、認識対象特定部112は、これらのキーワードと映像解析部111が出力した文字情報とを照合して、映像に映し出されている野球選手を特定する処理をおこなう。
メッセージ選択部113は、認識対象特定部112が特定した認識対象に対応するメッセージを記憶部120のメッセージデータベース122から選択する処理部である。認識対象に対応するメッセージが複数存在する場合は、所定の優先順位等に従ってどのメッセージを選択するかを判断する。なお、メッセージの優先順位の付け方については、本発明では特定しないものとする。本実施例においては、メッセージ選択部113は、認識対象特定部112が特定した野球選手に対応する応援メッセージを選択する処理をおこなう。
メッセージ出力部114は、メッセージ選択部113が選択したメッセージを出力先の装置が使用しやすい形で字幕情報として出力する処理部である。字幕情報は、たとえば、文字データでもよいし、文字データを所定の字体をもちいて映像化した映像データでもよいし、音声読み上げ技術をもちいて文字データを音声化した音声データでもよい。本実施例では、字幕合成装置400に対して文字データとして字幕情報を出力する。
メッセージ登録部115は、記憶部120のメッセージデータベース122にメッセージを登録する処理部である。本実施例では、野球中継の放送中にデータ放送の双方向サービスを使って視聴者から応援メッセージの登録を受付ける仕組みをとっており、データ放送装置300が出力したメッセージ情報をメッセージ登録部115がメッセージデータベース122に随時追加していくようになっている。
記憶部120は、各種情報を記憶する記憶部であり、既に説明したキーワードデータベース121およびメッセージデータベース122を有する。
このように、本実施例に係る字幕生成装置100は、映像を解析し、その解析結果と予め登録されたキーワードとを照合して映像に含まれている対象を特定し、特定した対象に関するメッセージをデータベースから取得して出力するように構成したので、人手を介すことなく、リルタイムに字幕情報を出力することができる。
次に、本実施例に係る字幕生成装置100の処理手順について説明する。図2は、図1に示した字幕生成装置100の処理手順を示すフローチャートである。同図に示すように、字幕生成装置100は、映像が入力されたならば、映像解析部111において入力映像を画像と音声に分離する(ステップS101)。
そして、画像については、画像に含まれるシンボルを認識し(ステップS102)、認識したシンボルを対応する単語に変換する(ステップS103)。また、音声については、音声認識をおこなって音声中の単語の抽出をおこなう(ステップS104)。
続いて、認識対象特定部112において、映像解析部111の認識結果である各単語をキーワードデータベース121のキーワードと照合して認識対象を特定する(ステップS106)。ここで、認識対象を特定できなかった場合は(ステップS106否定)、ステップS107〜108は実行しない。
認識対象特定部112において認識対象を特定できた場合は(ステップS106肯定)、メッセージ選択部113において、メッセージデータベース122から認識対象に対応するメッセージを選択し(ステップS107)、メッセージ出力部114を通じてそのメッセージを字幕情報として出力する(ステップS108)。この一連の処理を映像が入力される間繰り返し実行することで、字幕情報の出力処理が実現される。
次に、本発明に係る字幕生成装置100を野球中継における応援メッセージの表示に適用した場合の端末装置側の動作について例を示して説明する。ここでは、携帯電話を端末装置として使用する例にして説明する。地上波デジタル放送においては、携帯電話のような携帯端末向けの放送もおこなわれることとなっており、携帯電話をつかって野球中継を鑑賞する様態は一般的なものとなる。
図3−1〜3−7は、本発明に係る字幕生成装置100を野球中継における応援メッセージの表示に適用した場合の端末装置側の動作の一例を示すサンプル図である。この例では、データ放送画面の一部として野球放送が表示されており、応援メッセージを随時登録可能な状態となっている。
図3−1は、応援メッセージが字幕として表示される場面を示している。同図に示すように、画面の下部にはデータ放送の機能により、応援メッセージの送信を受付けている旨のメッセージと、機能キーに割当てられている機能についてのガイドが表示されている。携帯電話は、通常、左右2つの機能キーを備えており、この例では、左の機能キーには機能一覧メニューを表示する機能が割当てられ、右の機能キーには映像の録画を開始する機能が割当てられている。
このような画面は、放送電波の一部を使用して配信されたBMLフォーマットの電子データに基づいて表示される。BMLは、XML(eXtensible Markup Language)の一種で、データ放送の画面レイアウトや表示内容を定義したものである。
データ放送による表示部分の上部には、野球中継の画面が表示され、その画面の一部(この例では最上部)には、字幕生成装置100が生成した字幕情報が表示されている。この字幕情報の生成過程は以下の通りである。
まず、映像に写っている選手のユニフォームの背番号「10」と選手名「TANAKA」を画像認識し、これらの単語に対応する選手をキーワードデータベース121より検索する。あるいは、アナウンサーの「東京タワーズの田中、バッターボックスに入りました」というようなアナウンスを音声認識し、認識した各単語と最も関連が強い選手をキーワードデータベース121より検索する。
図4は、キーワードデータベース121のデータ構成の一例を示すサンプル図である。同図に示すように、キーワードデータベース121は、認識対象のIDと、認識対象の属性情報と、キーワードとを有する。キーワードデータベース121は、認識対象1つについてレコードが1つ存在し、認識対象の属性情報とキーワードが、1つのレコードについて複数存在する構成となっている。
図4の例では、選手毎にレコードが1つずつ存在する構成となっている。そして、レコード毎に認識対象の属性情報が2つ存在し、それぞれ、所属チーム名と、選手名とを格納するようになっている。また、レコード毎にキーワードが7つ存在し、それぞれ、チームのフランチャイズ名の読み仮名、チーム名の読み仮名、ユニフォームにおけるチーム名表記、選手の姓の読み仮名、選手の名の読み仮名、ユニフォームにおける選手名表記、背番号を格納するようになっている。
図3−1の例では、画像認識されたユニフォームの背番号「10」と選手名「TANAKA」から1行目の田中選手のレコードが認識対象として選択される。あるいは、音声認識された「とうきょう」、「たわーず」、「たなか」から1行目の田中選手のレコードが認識対象として選択される。
認識対象が特定されると、その認識対象に対応するメッセージをメッセージデータベース122から選択する。図5は、メッセージデータベース122のデータ構成の一例を示すサンプル図である。同図に示すように、メッセージデータベース122は、認識対象のIDと、メッセージのIDと、メッセージの本文と、優先順位と、出力回数とを有する。メッセージデータベース122は、認識対象1つについてレコードが複数存在する構成となっている。
認識対象のIDは、認識対象を識別するためのIDであり、キーワードデータベース121中の認識対象のIDと対応する。メッセージのIDは、メッセージを識別するためのIDであり、前レコードを通じて一意な値を保持する。メッセージの本文は、字幕情報として出力するメッセージである。優先順位は、同一の認識対象に複数のメッセージが存在する場合の優先順位であり、値が小さいほど優先順位が高くなる。出力回数は、そのメッセージを出力した回数である。
同一の認識対象に複数のメッセージが存在する場合にどのメッセージが選択されるかは、優先順位と出力回数によって決まる。たとえば、出力回数が最も小さいものの中で優先順位が最も高いものを選択する。なお、メッセージの選択方式は、字幕生成装置100の使用目的によって変更してよい。
図3−2は、視聴者が左の機能キーを押下した場面を示している。左の機能キーには機能一覧メニューを表示する機能が割当てられており、画面に機能一覧メニューが表示されている。この機能一覧メニューの表示内容もBMLにより定義されており、たとえば、双方向サービスのためのデータ通信をおこなう「通信」や番組の情報を案内する「番組情報」といった項目を有している。
図3−3は、機能一覧メニューにおいて「通信」を選択した後の場面を示している。「通信」を選択すると、データ放送装置300との間でデータ通信がおこなわれ、通信の結果として取得された画面が表示される。このデータ放送装置300とのデータ通信は、一般的なWEBサービスと同様の仕組みで実現される。この例では、応援メッセージを送信するか、応援メッセージ数を表示するかという選択画面が表示されている。
図3−4は、選択画面において応援メッセージの送信を選択した後の場面を示している。応援メッセージの送信を選択すると、再びデータ放送装置300との間でデータ通信がおこなわれ、ホームチームとビジターチームのどちらに応援メッセージを送信するかという選択画面が表示される。
図3−5は、チームの選択画面でいずれかのチームを選択した後の場面を示している。ホームチームとビジターチームのいずれかのチームを選択すると、再びデータ放送装置300との間でデータ通信がおこなわれ、応援メッセージを送信する対象の選手を選択する画面が表示される。この画面は、キーワードデータベース121等に格納された選手名情報から生成された選手名のリストを有しており、このリストから対象選手を選択するようになっている。
図3−6は、応援メッセージを送信する対象の選手を選択した後の場面を示している。選手を選択すると、再びデータ放送装置300との間でデータ通信がおこなわれ、応援メッセージを入力する画面が表示される。
図3−7は、応援メッセージを入力した後の場面を示している。応援メッセージを入力すると、再びデータ放送装置300との間でデータ通信がおこなわれ、入力した応援メッセージが字幕生成装置100のメッセージデータベース122に格納される。そして、その応援メッセージは、認識対象特定部112が当該の選手を認識対象として特定した場合に選択候補となる。応援メッセージの送信完了後、受信端末には応援メッセージが受付けられた旨の画面が表示される。
なお、ここでは、字幕生成装置100が生成した字幕情報である応援メッセージが放送局側で映像と合成されて放送される例を示したが、字幕情報を字幕放送によって野球中継の映像と別に放送することとしてもよい。あるいは、字幕情報を字幕放送ではなくデータ放送によって配信することとしてもよい。
上記実施例で説明した字幕生成装置100の各種の処理は、あらかじめ用意されたプログラムをコンピュータで実行することによって実現することができる。そこで、以下では、図6を用いて、本実施例に係る字幕生成装置100を実現するためのプログラムを実行するコンピュータの一例を説明する。
図6は、字幕生成プログラムを実行するコンピュータを示す機能ブロック図である。このコンピュータ1000は、ユーザからのデータの入力を受付ける入力装置1010、モニタ1020、各種プログラムを記録した記録媒体からプログラムを読取る媒体読取り装置1030、各種情報を一時記憶するRAM(Random Access Memory)1040、ネットワークを介して他のコンピュータとの間でデータの授受をおこなうネットワークインターフェース装置1050、映像の入力を受けるための映像入力インターフェース装置1060、HDD(Hard Disk Drive)1070およびCPU1080をバス1090で接続して構成される。
HDD1070には、字幕生成装置100の機能と同様の機能を発揮するプログラムである字幕生成プログラム1070cが記憶されている。そして、CPU1080が、字幕生成プログラム1070cをHDD1070から読み出して実行することにより、同プログラムは、字幕生成プロセス1080aとして機能するようになる。字幕生成プロセス1080aは、図1に示した制御部110に対応する。
また、CPU1080は、HDD1070からキーワードデータベース1070aおよびメッセージデータベース1070bとを読み出して、キーワードデータ1040aおよびメッセージデータ1040bとしてRAM1040に格納する。そして、RAM1040に格納されたキーワードデータ1040aおよびメッセージデータ1040bに基づいて各種データ処理を実行する。キーワードデータベース1070aは、図1に示したキーワードデータベース121に対応し、メッセージデータベース1070bは、メッセージデータベース122に対応する。
なお、上記の字幕生成プログラム1070cについては、必ずしもHDD1070に格納されている必要はなく、CD−ROM等の記憶媒体に記憶されたプログラムを、コンピュータ1000が読み出して実行するようにしてもよい。また、公衆回線、インターネット、LAN、WAN等を介してコンピュータ1000に接続される他のコンピュータ(またはサーバ)などにプログラムを記憶させておき、コンピュータ1000がこれらからプログラムを読み出して実行するようにしてもよい。
また、本実施例では、字幕生成装置100もしくは字幕生成プログラム1070cが放送局側に配置される場合について説明したが、受信端末側に配置される構成としてもよい。この場合、字幕生成装置100もしくは字幕生成プログラム1070cは、受信端末が受信した映像を入力され、この映像を基にした字幕情報を出力する。出力された字幕情報は、受信端末上で映像と重畳され、視聴者に提供される。この場合、キーワードデータベース121やメッセージデータベース122の内容は、視聴者自身が入力したものであってもよいし、データ通信によりダウンロードしたものであってもよい。
また、本実施例における装置およびプログラムの構成は一例であり、本実施例において1つとして構成されている装置およびプログラムが分散配置されていてもよいし、逆に、複数に分かれている装置およびプログラムの全体もしくは一部が統合されていてもよい。
上述してきたように、本実施例では、映像の内容を特定するためのキーワードと映像の内容に対応するメッセージとを記憶手段に格納しておき、入力される映像を逐次解析してその結果と記憶手段に格納されたキーワードとを照合して映像の内容を特定し、特定した内容と対応するメッセージを逐次出力するように構成したので、テレビの生放送のように内容が確定していない映像に対応してリアルタイムで字幕情報を生成することができる。
また、字幕の生成時に訓練された複数のオペレータを必要としないので、高い人件費や訓練費を必要とせず、低コストで字幕のリアルタイム生成を実現することができる。
(付記1)字幕情報を生成する字幕生成プログラムであって、
入力された映像を解析する解析手順と、
前記解析手順の解析結果と予め記憶手段に格納されたキーワードとを照合して映像の内容を特定する特定手順と、
映像の内容と関連付けて記憶手段に格納されたメッセージから前記特定手順が特定した内容に対応するメッセージを選択する選択手順と
をコンピュータに実行させることを特徴とする字幕生成プログラム。
(付記2)前記解析手段は、映像に含まれる音声を解析することを特徴とする付記1に記載の字幕生成プログラム。
(付記3)前記解析手段は、映像に含まれる画像を解析することを特徴とする付記1または2に記載の字幕生成プログラム。
(付記4)字幕情報の生成をおこなっている最中に前記記憶手段にメッセージを登録することが可能なメッセージ登録手順をさらにコンピュータに実行させることを特徴とする付記1〜3のいずれか一つに記載の字幕生成プログラム。
(付記5)字幕情報を生成する字幕生成装置であって、
入力された映像を解析する解析手段と、
前記解析手段の解析結果と予め記憶手段に格納されたキーワードとを照合して映像の内容を特定する特定手段と、
映像の内容と関連付けて記憶手段に格納されたメッセージから前記特定手段が特定した内容に対応するメッセージを選択する選択手段と
を備えたことを特徴とする字幕生成装置。
(付記6)前記解析手段は、映像に含まれる音声を解析することを特徴とする付記5に記載の字幕生成装置。
(付記7)前記解析手段は、映像に含まれる画像を解析することを特徴とする付記5または6に記載の字幕生成装置。
(付記8)字幕情報の生成をおこなっている最中に前記記憶手段にメッセージを登録することが可能なメッセージ登録手段をさらに備えたことを特徴とする付記5〜7のいずれか一つに記載の字幕生成装置。
以上のように、本発明に係る字幕生成プログラムおよび字幕生成装置は、字幕情報の生成に有用であり、特に、映像に対応した字幕をリアルタイムに生成することを低コストで実現することが必要な場合に適している。
本実施例に係る字幕生成装置の構成を示す機能ブロック図である。 図1に示した字幕生成装置の処理手順を示すフローチャートである。 端末装置側の動作の一例を示すサンプル図である。 端末装置側の動作の一例を示すサンプル図である。 端末装置側の動作の一例を示すサンプル図である。 端末装置側の動作の一例を示すサンプル図である。 端末装置側の動作の一例を示すサンプル図である。 端末装置側の動作の一例を示すサンプル図である。 端末装置側の動作の一例を示すサンプル図である。 キーワードデータベースのデータ構成の一例を示すサンプル図である。 メッセージデータベースのデータ構成の一例を示すサンプル図である。 字幕生成プログラムを実行するコンピュータを示す機能ブロック図である。
符号の説明
100 字幕生成装置
110 制御部
111 映像解析部
112 認識対象特定部
113 メッセージ選択部
114 メッセージ出力部
115 メッセージ登録部
120 記憶部
121 キーワードデータベース
122 メッセージデータベース
200 映像入力装置
300 データ放送装置
400 字幕合成装置
1000 コンピュータ
1010 入力装置
1020 モニタ
1030 媒体読取り装置
1040 RAM
1040a キーワードデータ
1040b メッセージデータ
1050 ネットワークインターフェース装置
1060 映像入力インターフェース装置
1070 HDD
1070a キーワードデータベース
1070b メッセージデータベース
1070c 字幕生成プログラム
1080 CPU
1080a 字幕生成プロセス
1090 バス

Claims (5)

  1. 放送を受信する受信端末から通信回線を介してデータの入力を受け付けるコンピュータに、前記放送において前記受信端末に表示される字幕情報を生成する機能を実現させる字幕生成プログラムであって、
    前記受信端末から受け付けた映像内容とメッセージとを対応付けてメッセージデータベースに格納するメッセージ登録手順と、
    放送される映像を解析して文字情報を抽出する解析手順と、
    前記解析手順で抽出された文字情報をキーとして、キーワードと映像内容を対応付けて格納したキーワードデータベースを検索して映像内容を特定する特定手順と、
    前記特定手順で特定された映像内容に対応付けられたメッセージを前記メッセージデータベースから読み出し、所定の規則に基づいて選択する選択手順と
    をコンピュータに実行させることを特徴とする字幕生成プログラム。
  2. 前記解析手段は、映像に含まれる音声を解析することを特徴とする請求項1に記載の字幕生成プログラム。
  3. 前記解析手段は、映像に含まれる画像を解析することを特徴とする請求項1または2に記載の字幕生成プログラム。
  4. 前記メッセージデータベースにおいて、前記メッセージには所定の優先順位と出力回数とが対応付けて格納され、
    前記所定の規則は、前記特定手順で特定された映像内容に対応付けられたメッセージのうち、対応付けられている前記出力回数が最も少ないメッセージの中で、対応付けられている前記優先順位が最も高いメッセージを選択する規則であることを特徴とする請求項1〜3のいずれか一つに記載の字幕生成プログラム。
  5. 放送を受信する受信端末から通信回線を介してデータの入力を受け、前記放送において前記受信端末に表示される字幕情報を生成する字幕生成装置であって、
    前記受信端末から受け付けた映像内容とメッセージとを対応付けてメッセージデータベースに格納するメッセージ登録手段と、
    放送される映像を解析して文字情報を抽出する解析手段と、
    前記解析手段で抽出された文字情報をキーとして、キーワードと映像内容を対応付けて格納したキーワードデータベースを検索して映像内容を特定する特定手段と、
    前記特定手段で特定された映像内容に対応付けられたメッセージを前記メッセージデータベースから読み出し、所定の規則に基づいて選択する選択手段と
    を備えたことを特徴とする字幕生成装置。
JP2005123493A 2005-04-21 2005-04-21 字幕生成プログラムおよび字幕生成装置 Expired - Fee Related JP4320001B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005123493A JP4320001B2 (ja) 2005-04-21 2005-04-21 字幕生成プログラムおよび字幕生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005123493A JP4320001B2 (ja) 2005-04-21 2005-04-21 字幕生成プログラムおよび字幕生成装置

Publications (2)

Publication Number Publication Date
JP2006303959A JP2006303959A (ja) 2006-11-02
JP4320001B2 true JP4320001B2 (ja) 2009-08-26

Family

ID=37471714

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005123493A Expired - Fee Related JP4320001B2 (ja) 2005-04-21 2005-04-21 字幕生成プログラムおよび字幕生成装置

Country Status (1)

Country Link
JP (1) JP4320001B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6344849B2 (ja) * 2014-06-26 2018-06-20 日本放送協会 映像識別器学習装置、及びプログラム
JP2018010569A (ja) * 2016-07-15 2018-01-18 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
JP2006303959A (ja) 2006-11-02

Similar Documents

Publication Publication Date Title
CA2924065C (en) Content based video content segmentation
CN101150699B (zh) 信息处理装置和信息处理方法
US20070199038A1 (en) System and method for providing personal broacast recording channel service using extensible markup language
JP5135024B2 (ja) コンテンツのシーン出現を通知する装置、方法およびプログラム
US8307403B2 (en) Triggerless interactive television
US11227620B2 (en) Information processing apparatus and information processing method
JP5277184B2 (ja) 選択肢生成提示装置及び選択肢生成提示プログラム
JP4388128B1 (ja) 情報提供サーバ、情報提供方法及び情報提供システム
JP2009542088A (ja) カスタマイズされたマルチメディア・セグメントを作成しかつ視聴するための方法と装置
JP4973906B2 (ja) 情報処理装置および方法、並びにプログラム
US9544544B2 (en) Method and system for sharing information between users in media reproducing system
JP2005295375A (ja) 情報取得支援システム
JP5857449B2 (ja) 画像処理装置及び録画装置
CN101365134B (zh) 帧指定方法
TW201225669A (en) System and method for synchronizing with multimedia broadcast program and computer program product thereof
JP5159492B2 (ja) 特定シーン学習システム及びプログラム
JP4320001B2 (ja) 字幕生成プログラムおよび字幕生成装置
CN106060641A (zh) 用于搜索的显示装置及其控制方法
CN106713973A (zh) 搜索节目的方法及装置
CN109792502A (zh) 信息处理设备、信息处理方法、程序和信息处理系统
JP2009005260A (ja) コンテンツ視聴装置
KR100768074B1 (ko) 광고 동영상을 제공하는 시스템 및 그 서비스 방법
JP2005130075A (ja) テレビジョン受信機
KR101930488B1 (ko) 연동형 서비스 제공을 위한 메타데이터 생성 방법 및 그를 위한 장치
JP2006054517A (ja) 情報提示装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060726

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090526

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090529

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120605

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4320001

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120605

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130605

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130605

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees