JP2003224774A - 半自動型字幕番組制作システム - Google Patents
半自動型字幕番組制作システムInfo
- Publication number
- JP2003224774A JP2003224774A JP2002019209A JP2002019209A JP2003224774A JP 2003224774 A JP2003224774 A JP 2003224774A JP 2002019209 A JP2002019209 A JP 2002019209A JP 2002019209 A JP2002019209 A JP 2002019209A JP 2003224774 A JP2003224774 A JP 2003224774A
- Authority
- JP
- Japan
- Prior art keywords
- subtitle
- text
- program
- area
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Management Or Editing Of Information On Record Carriers (AREA)
- Studio Circuits (AREA)
- Television Signal Processing For Recording (AREA)
- Television Systems (AREA)
Abstract
に支援する実用性のより高い半自動型字幕番組制作シス
テムを提供する。 【解決手段】 テレビ素材番組の映像、音声、タイムコ
ードに基づいてスピーチに対する字幕用テキストの書き
起こしおよび背景音などの付加情報データを入力する字
幕テキスト書き起こし部30と、書き起こされた字幕テ
キストに基づいて字幕画面作成およびタイミング付与を
行う自動字幕番組データ制作部40と、作成された字幕
番組データの編集および試写を行う字幕番組編集・試写
部50とを備える。
Description
能と自動による制作機能とを効果的に組み合わせた半自
動型字幕番組制作システムに関する。
制作システムは、ディスク記録再生装置に収録してある
テレビ素材番組の映像、音声、タイムコードを効果的に
操作し、スピーチに対する字幕用テキストの書き起こし
および背景音などの付加情報データを効率的に入力する
機能と、これらテキストやデータを利用し、自動で字幕
画面作成およびタイミング付与を行う自動字幕番組デー
タ制作機能と、字幕番組データの編集および試写を行う
編集・試写機能とを備えるものである。
子化原稿のない番組や背景音レベルの大きい番組など、
多様な番組の字幕制作にも対応可能な字幕番組制作シス
テムであり、今後適用番組分野、番組数などの拡大が見
込まれる字幕放送の番組制作システムとして、大きな効
果が期待される。
ンタリー番組を対象とし、電子化原稿が存在する場合の
オフラインで字幕番組を制作する技術として、本発明者
らは、「自動要約」、「自動同期」「自動画面作成技
術」などをテーマとして研究を進め、これまでの研究成
果を集約した「自動字幕制作システム」を構築した。こ
れらの要点は既に特許出願済である(例えば、特開20
00−270263、特開2000−324395
等)。
聴覚障害者などによって評価した結果、一定の性能、機
能があることが確認されたが、実用化のためには、未だ
多くの課題が残されている。
であり、電子化原稿が存在しない番組、ドラマやバラエ
ティなどの番組分野への拡大である。しかし、現状の自
動字幕制作システムの機能・性能から見た字幕制作可能
なテレビ番組分野は、かなり限られたものであり、自動
機能として限界があるため、この限界以上の部分は、手
動による字幕制作や試写・修正の範囲でカバーせざるを
得ない。
術、知識をもった多くの専門家が携わっており、字幕制
作はこのような人間の能力に負っている部分が多くあ
る。
いる状況下、字幕制作作業者もこのような専門家のみに
頼るのみでは不十分であり、専門家ではないワープロ作
業が一応できる程度の者であっても作業の一端を分担で
きるシステムが望ましい。
決のためには、自動処理を前提とした字幕制作システム
のみならず、手作業を含む字幕用電子化テキストの作成
や字幕画面の試写・編集などの作業も含めたトータルシ
ステムとして、番組制作効率を考えていく必要性があ
る。
して、1)多様なテレビ番組の字幕制作を、時間、人
手、費用などの点で効率的にできるシステム、2)その
ため、研究を進めている自動字幕制作機能と、多彩な支
援機能を盛り込んだ手動字幕制作機能とを効果的にタイ
アップした機能・構成、3)字幕制作担当者の観点から
の作業形態などに関するシステムフレキシビリティの向
上などが切望されている。
された自動字幕制作システムのシステム評価などから得
られた知見をもとに、各自動化要素技術を高性能化した
新しい自動字幕制作システムを中核にするとともに、字
幕番組制作者による手動字幕制作を効率的に支援する実
用性のより高い半自動型字幕番組制作システムを提供す
ることを目的としている。
めに本発明は、請求項1では、テレビ素材番組の映像、
音声、タイムコードに基づいてスピーチに対する字幕用
テキストの書き起こしおよび背景音などの付加情報デー
タを入力する字幕テキスト書き起こし部と、書き起こさ
れた字幕テキストに基づいて字幕画面作成およびタイミ
ング付与を行う自動字幕番組データ制作部と、作成され
た字幕番組データの編集および試写を行う字幕番組編集
・試写部とを備えたことを特徴としている。
字幕制作システムにおいて、前記字幕テキスト書き起こ
し部におけるマンマシンインタフェースとなるメイン画
面は、現在作業中の映像を表示する映像表示エリアと、
この映像に対応する書き起こし中の字幕用テキストを表
示する字幕用テキスト表示エリアと、前記作業中の映像
に対応した一定間隔毎若しくはカット変わりなどの画像
と、各画像に対応する書き起こされた字幕用テキスト
と、各字幕用テキストの書き起こしの基となる音声に関
する波形とがタイムライン上に一覧表示された一覧表示
エリアと、各エリアに対する制御エリアと、を少なくと
も備え、このメイン画面により作業者の字幕テキスト書
き起こし作業を支援することを特徴としている。
半自動型字幕番組制作システムにおいて、前記字幕番組
編集・試写部におけるマンマシンインタフェースとなる
メイン画面は、現在編集・試写中の映像を表示する映像
表示エリアと、この映像に対応する書き起し済の字幕用
テキストを表示する字幕用テキスト表示エリアと、前記
編集・試写中の映像に対応した一定間隔毎若しくはカッ
ト変わりなどの画像と、各画像に対応する書き起こされ
た字幕用テキストと、各字幕用テキストの書き起こしの
基となった音声に関する波形とがタイムライン上に一覧
表示された一覧表示エリアと、各エリアに対する制御エ
リアと、を少なくとも備え、このメイン画面により作業
者の字幕テキスト編集・試写作業を支援することを特徴
としている。
ない番組や背景音レベルの大きい番組など、多様な番組
の字幕制作にも対応可能な字幕番組制作システムが構築
でき、今後適用番組分野、番組数などの拡大が見込まれ
る字幕放送の番組制作システムとして、大きな効果が期
待される。
番組制作システムの実施形態を示すブロック図である。
番組制作システム100は、基本GUIシステム部10
と、ディスク記録・再生部20と、字幕テキスト書き起
こし部30と、自動字幕番組データ制作部40と、字幕
番組編集・試写部50とを備えている。
字幕番組制作システムの一構成品として、マンマシンイ
ンターフェース、内部各システムのインターフェースお
よび制御、外部とのデータ入出力制御を行う。また、本
字幕番組制作システム100の自動字幕番組データ作成
機能のインターフェース・制御機能も備えており、多様
な番組の効率的な字幕制作を行う字幕番組制作システム
100を統括制御するものである。
TR(例えばデジタル・ビデオ・テープ・レコーダ)6
0から供給される素材番組の映像・音声を必要ならば圧
縮して記録するとともに、記録された映像音声を再生す
るために使用される。この番組素材VTR60は、番組
素材が収録されている番組素材VTRテープから、映
像、音声、およびそれらのタイムコード(TC)を再生
出力する機能を有しており、これら素材映像、音声およ
びタイムコード(TC)がディスク記録・再生部20に
記録されるようになっている。
キスト書き起こし部30は、素材番組の音声を聞き取っ
て、字幕用テキストの書き起こしや付加データを入力す
るとともに、素材番組の映像・音声の活用による効果的
な手動作業支援をするための機能部分であり、具体的に
は、ディスク記録再生制御機能31と、情報表示機能3
2と、データ作成制御機能33と、データ作成画面表示
機能34と、主映像表示機能35とを備えている。
能31は、各機能に応じた操作キーを備えており、素材
番組の映像・音声を、ディスク記録・再生部20に記録
させる記録制御を実行するとともに、記録された映像音
声を再生させる再生制御を実行する。特にスピーチ区間
では任意の低速再生を行うとともに、変速率に応じたピ
ッチコントロールを行い、書き起こしに適した速度でか
つ音程がほぼ不変とする話速変換機能をも備えている。
加情報データ入力の手動作業を支援するため、素材番組
の映像・音声、書き起こしテキストなどに関する各種の
情報を、タイムライン上にビジュアル表示する。
テキストやスピーチポーズの時間データなどの入力操作
のための操作キーを備え、対応する動作をする。
テキスト・入力したデータの表示・編集などのための画
面を表示し、対応する動作をする。
して、現在作業位置の画像を表示する。
幕番組制作システム40は、テキスト自動要約機能41
と、表示単位字幕作成機能42と、タイミング検出・付
与機能43とを備えている。なお、この自動字幕番組デ
ータ制作部40の詳細については、後述する。
番組データ編集・試写部50は、作成した書き起こしお
よび付加情報データを基にして自動字幕番組データ制作
部40で自動制作された字幕番組データを人手で編集・
試写するためのものであり、素材番組の映像・音声、字
幕番組データなどの高度活用による効果的な手動作業支
援のための特別の機能を備えている。
1は、自動制作した字幕番組データおよび記録された映
像・音声に関して、指定時間、字幕ページ、字幕ブロッ
クなど編集・試写作業支援用特殊表示操作のための専用
操作キーを備え、対応する動作をする。
は、字幕番組データ編集の手動作業を支援するため、素
材番組の映像、字幕本文、音声に関する波形等の各種情
報をタイムライン上にビジュアル表示する。
ング変更支援画面を表示し、この画面に対応する動作の
実行が可能とされている。
ページ単位編集のための専用操作キーを備え、字幕デー
タをページ単位で編集する動作を実行可能に構成されて
いる。
重畳した指定字幕データ表示のための操作キーを備え、
各操作キーに対応する動作が実行可能に構成されてい
る。
写など、試写形式の選択に必要な操作キーを備え、各操
作キーに対応する動作が実行可能に構成されている。
機能構成の詳細>次に、上記構成を有する半自動型字幕
番組制作システム100で実行される処理を字幕テキス
ト書き起こし部30,自動字幕番組データ制作部40お
よび字幕番組編集・試写部50の各部毎に詳細に説明す
る。
≫字幕テキスト書き起こし部30における主要な作業
は、番組のスピーチを聞き取り、その内容を書き起こす
とともに、その一区切りに対してその開始・終了タイミ
ングとスピーチ者(話者)をデータ化するものである。
を容易にする支援機能として、作業者が番組のスピーチ
を正しく聞き取り、自分のペースで書き起こしできるよ
うにすることが基本である。聞き取り易く書き起こしが
容易であること、話者・タイミングを把握しやすいこ
と、書き起こしデータを簡単に修正できることなどが重
要である。このように、本システム100の字幕テキス
ト書き起こし部30には種々の手作業支援機能が盛り込
まれている。
は、字幕テキストファイル(XML)の編集を行う機能
を備えている。
N TIME,OUT TIME)と話者、字幕本文よ
り構成されたデータをいう。
20に保存されたMPEG/AVI映像ファイルを使用
して、音声の聞き取り、タイミングの調整、字幕ポジシ
ョンの調整を行うことができる。
で使用されるメイン画面の構成が示されている。同図に
示すメイン画面301を使用して、字幕テキストの編集
や、各補助機能の操作が行われる。画面のサイズは、例
えば、1280×1024(画素数)が望ましい。
と、編集領域303と、一覧領域304と、制御領域3
05の4つの領域に大別される。
しを行う領域であり、メニューバーとツールバーに用意
された項目を実行することにより、各種機能の呼び出し
を行う。
入力後の字幕テキストの編集のための領域であり、図3
の上段に示されるように、時間枠(IN TIME,OUT TIME)
エリア303A、話者エリア303B、字幕本文エリア
303Cに一対の入力データとして一覧表示されるよう
になっている。
リア303F)には、入力する内容が表示される。この
領域を利用して、例えば話者単位で各作業を行う。
定は、ページのIN TIME/OUT TIME設定エ
リア303Dから行う。前のページで設定した時間内に
含める場合には、前のページの時間と同じ値のままで確
定する。
録”エリア303Eで予め登録された話者の中から選択
する。
エリア303Fで入力される。
03Gは、入力設定されたエリア303D,303E,
303Fの内容を入力一覧の最後に追加する。“挿入”
ボタン303Hは、入力された内容を入力一覧で選択さ
れた一対のデータの次へ挿入する。
ボタン303Kは、入力一覧で選択された一単位を切り
取り/コピーするものである。また、“貼り付け”ボタ
ン303Lは、切り取り/コピー機能で記録された一単
位を入力一覧で選択された箇所の次へ貼り付けるために
使用される。
に、画像とこの画像に対応する作成中の字幕テキストを
表示する領域であり、MPEG/AVI映像ファイルよ
り一定間隔毎若しくはカット変わりなどの画像一覧を表
示する画像エリア304A、入力されたテキストの内容
である字幕本文を表示する字幕本文エリア304Bと、
作成中の字幕本文に対応するスピーチの音声に対応する
波形を表示する波形エリア304Cと、波形エリア30
4Cに表示される波形などこの一覧領域304の時間指
標となるタイムラインが表示されるタイムラインエリア
304Dとから成っている。この一覧領域304によっ
て書き起こし作業者の入力支援が効果的に行われる。
VI映像ファイルなどの再生位置カーソル304Eが表
示されており、この再生位置304Eを変えることによ
り、画像の再生位置など書き起こし作業を行うタイムラ
イン上のタイミング変更が可能になる。
りである。上述したように、この一覧領域304には、
映像ファイルから形成した静止画像と、編集データとし
ての字幕本文、波形がタイムライン上に一覧表示され
る。一画面で表示する幅は、“ツール(T)”の“オプシ
ョン”で選択された120秒、60秒、30秒のいずれ
かとなる。
の画像を抜き出したもの若しくはカット変わりが表示さ
れる。画像のサイズは160×120、間隔は全体幅が
120秒の時は20秒、60秒の時は10秒、30秒の
時は5秒となる。
入力された本文の内容が表示される。枠の幅は時間幅を
表している。幅が狭く、本文が表示しきれない場合には
省略される。
変更した場合には、対象一件の幅(時間幅)の変更を、
本文の部分304Bの枠をドラッグで変更した場合に
は、二件の境界線の変更を行うことができる。
303が編集途中でなければ、入力一覧304で指定し
た内容を表示できる位置に移動することができる。
る音声(音楽、効果音を含む)信号を処理し波形化し
て、図4のように表示する。スピーチやポーズの位置を
視覚的に判断できるようにした支援機能である。なお、
波形としては、スピーチ区間とポーズ区間とを明確にす
るために、矩形波状に波形整形して表示するようにして
も良い。
位は、映像ファイルからタイムコードを読み込む際の最
小単位を設定する。取り込みを実行した際、設定値未満
の値は切り捨てされる。この場合の“設定”は、1フレ
ーム/5フレーム/10フレーム/15フレーム/1秒
である。
覧領域304にどれだけの時間分を表示するかを設定す
る。この場合の“設定”は、30秒/60秒/120秒
で、それに合わせて画像も5秒間隔、10秒間隔、20
秒間隔となる。
I映像の制御のための領域であり、MPEG/AVI映
像の表示エリア305Aや、時間枠の取り出しボタン、
MPEG/AVI再生の開始、停止ボタンなどが用意さ
れている。また、制御領域305には、映像ファイルの
再生に関するインターフェースが用意されている。映像
のサイズは、640×480である。
例えば、タイムコード表示部305Bと、再生/停止ボ
タン305Cと、再生位置トラックバー305Dと、M
ARK INボタン305Eと、MARK OUTボタン
305Fと、繰り返し再生ボタン305Gと、話速変換
ボタン305H、<<5秒/5秒>>ボタンなどが用意
されている。
タイムコードは、プロジェクト新規作成の際に入力され
たイニシャルタイムを基準として、映像ファイルの再生
位置の時間を足した時間である。なお、映像ファイルの
再生位置は、29.97フレームを1秒として扱われ
る。
再生スタートと再生ストップを行う。なお、“停止”ボ
タンが実行されても、映像は消えない。
像ファイルのどの部分を再生しているかを示す。また、
トラックバーを動かすことにより、再生位置を変更する
ことも可能である。
集領域のIN TIMEの欄へ、現在の映像の時間をコ
ピーする。“MARK OUT”ボタン305Fは、編
集領域のOUT TIMEの欄へ、映像の現在の時間を
コピーする。
領域のIN TIMEとOUT TIMEの期間の画像を
繰り返し作成する。
RK IN”ボタン305Eをクリックすることでなさ
れる。
生する際の音声のスピード調節を行う際に使用される。
は、映像の再生位置を前/後ろに5秒移動する際に使用
される。
し部30で実行される書き起こし処理の手順を図5のフ
ローチャートを参照しつつの具体的に説明する。
像再生が開始されると、先ず、発話タイミングが探索さ
れる(ステップST11)。
されると、これがスピーチ区間の開始点となる(ステッ
プST12)。
れ、書き起こし作業が実行される(ステップST13,
14)。スピーチ終了が認識されると、適宜巻き戻して
発話終了点が探索される(ステップST15)。
ると、(終了点)通常再生モードへ移行する(ステップ
ST16)。
要約支援が実行されるとともに、背景音情報が登録され
る(ステップST17,18)。
番組データ制作部40の処理へ移行する(ステップST
19)。
りの書き起こしが完了した後、そのテキストの用字、用
語チェック、必要ならば要約支援を実行して必要なテキ
ストの修正を行い、その後背景音情報などをチェックし
情報を登録する。登録後、テキスト作成関係の作業を終
了し、自動字幕番組データ制作部40の処理へ進むので
ある。
自動型字幕番組制作システムの書き起こし支援を提示す
るものであり、以下のような利点を有する。
タイムコードをノンリニア操作が容易なディスク記録再
生装置に収録するとともに効果的に操作・処理すること
によって、スピーチに対する字幕用テキストの書き起こ
しおよび背景音などの付加情報データを効率的に入力す
ることが可能となる。
能力に依存する手作業によらざるを得ないが、テレビ素
材番組の映像、音声などを効果的に操作・処理して、こ
の書き起こしなどの手作業を支援することが可能とな
る。
テレビ素材番組を収録したVTRテープを適宜操作して
映像、音声を再生し、音声中のスピーチをテキストとし
て書き起こすとともに、その開始・終了時間もVTRの
タイムコードを利用して記録しているが、その過程で該
当スピーチ部分の頭出し、スピーチ部分の書き起こしに
適した速度での再生や繰り返し再生、スピーチ部分終了
点の確認などの複雑なVTR操作が行われる。この点に
関しては、話速変換技術を適用して書き起こし作業者の
聞き取り能力に応じて話速を遅くしたり早くしたりでき
るので、書き起こし作業が容易にでき、また、タイミン
グを合わせも容易にすることができる。
図6は自動字幕番組データ制作部40において実行され
る表示字幕文へのタイミング付与の処理手順の一例とし
て、音声認識手法に代わるタイミング検出手法の適用で
高速化したフローチャートである。
グ、継続時間を求める。その適否を検証し必要な修正を
する(図6のステップST21)。なお、ポーズ時間の
検出機能は、音声認識処理をすることなく、素材VTR
から供給される音声のレベルや継続時間、およびそのタ
イムコードから、例えばそのレベルが指定レベル以下で
連続する開始、終了タイムコードを検出するものであ
り、ブロック・ケプストラム・フラックス法などの方法
によって実行される。
上)で字幕用テキストをブロックに分割し、ブロックテ
キスト文としてその開始、終了タイミングを付与する
(ステップST22,23)。
その総読み数(計算推定)で割り、当該範囲の平均読み
速度を求める(ステップST24)。
さのポーズ箇所などを改行点とする表示単位字幕文に分
割する(ステップST25)。この場合、予め定められ
た分割ルールを適用する。
するタイミングを、ブロックテキスト文の開始、終了タ
イミングやポーズのタイミング、平均読み速度を基に計
算し、付与する。この場合、文字数、文字種法、または
発音数法を適用する(ステップST26)。
ックし、必要ならば終了タイミングを修正する(ステッ
プST27)。
字幕文へのタイミング付与が実行され、自動字幕番組デ
ータが作成される。
≫上述のようにして作成された字幕番組データは字幕番
組データ編集・試写部50による編集・試写処理によっ
て最終的な字幕番組として完成される。この機能におけ
る作業は、一応出来上がった字幕番組データを専門知識
を有する作業者が試写し、必要ならば修正するものであ
り、作業者がチェックし易い試写形態、字幕内容、改行
・改頁、タイミングなどに関する修正編集がし易いよう
支援する機能が盛り込まれている。
間、字幕本文、および管理情報より構成された字幕番組
データを字幕素材と仮称する。
ァイルを使用して、タイミングの調整や、字幕ポジショ
ンの調整を行うことができる。なお、字幕素材編集の入
出力は、文字放送のNAB形式のファイルのみとなる。
このファイルは、他の『ページ一覧』『ページ利用』
『デジタル形式変換』の入出力形式になる。
されるメイン画面の構成を示している。このメイン画面
は、字幕素材編集のために使用される。このメイン画面
を使用して、字幕素材の編集や各補助機能の操作を行
う。なお、画面のサイズは、1280×1024であ
る。
ー領域502と、編集領域503と、一覧領域504の
3つの領域に分かれている。
しを行う部分であり、メニューバーとツールバーに用意
された項目を実行することにより、各種機能の呼び出し
を行うことができる。
に、映像エリア503Aを備えている。この映像エリア
503Aは、システム内に保存されているMPEG/A
VIファイルを再生した映像を表示するエリアと、文字
入力ソフトを使用して入力された字幕本文が表示される
エリアとから成っており、本文と画像の位置調整にも使
用できる。通常の試写では、この編集領域503を使用
して確認を行う。また、再生の停止や、IN TIM
E、OUT TIMEの取り込み、リピート再生などの
操作を行うことが可能である。映像エリア503Aの画
像のサイズは、640×480である。
Bは、タイムコードを表示する部分であり、再生してい
る映像の位置は29.97フレーム1秒として再生され
る。
タートに使用され、“停止”ボタン503Cは、映像の
再生ストップに使用される。なお、“停止”ボタン50
3Cが押されても、映像がストップされるだけで映像そ
のものは画面上からは消えない。
像ファイルのどの部分を再生しているかを示すものであ
る。このトラックバーを動かすことにより、再生位置を
変更することが可能である。
集領域のIN TIMEの欄へ、現在の映像の時間をコ
ピーするボタンである。“MARK OUT”ボタン5
03Gは、編集領域のOUT TIMEの欄へ、映像の
現在の時間をコピーするボタンである。
領域のIN TIMEとOUT TIMEの期間の画像を
繰り返し作成するために使用される。
“MARK IN”ボタンを操作することにより成され
る。
は、映像ファイルの再生位置を5秒分だけ進め/戻すた
めのボタンである。繰り返し再生中に実行された場合に
は、通常再生に切り替わる。
データの入力や、入力後の編集を行う他に映像セクショ
ンを兼ねていて、映像エリア503A上に重ねて試写を
実行する際にも利用される。“前ページ”と“後ペー
ジ”は、現在中央に表示されている字幕データページの
前と後のページの字幕を表示する領域である。
ア503A上に表示されている枠カーソルを使用して、
新たな文字の入力を行う。入力を行った文字の色サイズ
は、右上のリストボックスで設定した内容になる。
し、削除/複写/移動や、属性(色、サイズ、囲み等)
の変更を行うことができる。
ページのIN TIME/OUT TIMEの設定を行
う。“MARK IN”ボタン503F、“MARK O
UT”ボタン503Gにより、映像ファイルの再生タイ
ミングを“IN TIME/OUT TIME”として取
り込むことができる。
Lは、編集領域503に、これから新規に入力する文字
の前景色/背景色/文字サイズを設定する。
文字の入力位置の目安とする基準線を表示するかを設定
するものである。
の素材の最後に、新たなページを追加し、そのページを
編集対象として表示するために使用される。“ページ挿
入”ボタン503Pは、現在編集しているページの前か
後に、新たにページを挿入し、そのページを編集対象と
して表示するために使用される。“ページ削除”ボタン
503Qは、現在編集中のページを削除するために使用
される。なお、ページ削除を実行する際には、確認操作
が入る。
対象としているページの少し前より試写を開始し、“試
写終了”ボタン503Sが実行されるまで、試写を行う
際に使用される。
しているページの前のページより試写を開始し、次のペ
ージのOUT TIME後に試写を終了する。途中で
“試写終了”ボタンにて終了することも可能である。
用して『通し試写』と同じ動作を行う。“試写終了”ボ
タンは、現在行っている試写を中止する。
る。
する作成済みの字幕テキストを表示する領域であり、M
PEG/AVI映像ファイルより一定間隔毎若しくはカ
ット変わりの画像一覧を表示する画像エリア504A、
作成されたテキストの内容である字幕本文を表示する字
幕本文エリア504Bと、作成された字幕本文に対応す
るスピーチの音声に関連した波形を表示する波形エリア
504Cと、波形エリア504Cに表示される波形の時
間指標となるタイムラインが表示されるタイムラインエ
リア504Dとから成っている。この一覧領域504に
よって編集・試写作業者の作業支援が効果的に行われ
る。
で表示する幅は、“ツール(T)”の“オプション”で選
択された120秒、60秒、30秒のいずれかとなる。
毎若しくはカット変わりなどの画像を抜き出し、表示す
る。画像のサイズは160×120、間隔は全体幅が1
20秒の時は20秒、60秒の時は10秒、30秒の時
は5秒となる。
入力された本文の内容が表示される。枠の幅は時間幅を
表している。なお、幅が狭く、本文が表示しきれない場
合には省略される。
で変更した場合には、対象一件の幅(時間幅)の変更
を、本文の部分の枠をドラッグで変更した場合には、二
件の境界線の変更を行う。
503が編集途中でなければ、入力一覧で指定したペー
ジを編集対象のページ変更する。
る音声(音楽、効果音を含む)信号を処理し波形化した
ものが表示される。なお、波形としては、スピーチ区間
とポーズ区間とを明確にするために、矩形波状に波形整
形して表示するようにしても良い。
位は、映像フィルムからタイムコードを読み込む際の最
小単位を設定する。取り込みを実行した際、設定値未満
の値は切り捨てされる。この場合の“設定”は1フレー
ム/5フレーム/10フレーム/15フレーム/1秒で
ある。
覧領域にどれだけの時間分を表示するかを設定する。こ
の場合の“設定”は、30秒/60秒/120秒で、そ
れに合わせて画像も5秒間隔、10秒間隔、20秒間隔
となる。
を進めている自動字幕制作機能と、多彩な支援機能を盛
り込んだ手動字幕制作機能とを効果的にタイアップした
機能・構成を構築でき、多様なテレビ番組の字幕制作
を、時間、人手、費用などの点で効率的にできるシステ
ムを提供できる。そのため、字幕制作作業者の観点から
の作業形態などに関するシステムフレキシビリティが向
上する。
れまでに開発された自動字幕制作システムのシステム評
価などから得られた知見をもとに、各自動化要素技術を
高性能化した新しい自動字幕制作システムを中核にする
とともに、字幕番組制作者による手動字幕制作を効率的
に支援する実用性のより高い半自動型字幕番組制作シス
テムを提供することが可能となる。
テムは、電子化原稿のない番組や背景音レベルの大きい
番組など、多様な番組の字幕制作にも対応可能であり、
今後適用番組分野、番組数などの拡大が見込まれる字幕
放送の番組制作システムとして、大きな効果が期待でき
る。
実施形態を示すブロック図である。
構成する字幕テキスト書き起こし部で使用されるメイン
画面の構成を示す説明図である。
説明図である。
説明図である。
構成する字幕テキスト書き起こし部の処理手順を示すフ
ローチャートである。
表示字幕文へのタイミング付与の処理手順の一例を示す
フローチャートである。
構成する字幕番組編集・試写部で使用されるメイン画面
の構成を示す説明図である。
説明図である。
説明図である。
Claims (3)
- 【請求項1】 テレビ素材番組の映像、音声、タイムコ
ードに基づいてスピーチに対する字幕用テキストの書き
起こしおよび背景音などの付加情報データを入力する字
幕テキスト書き起こし部と、 書き起こされた字幕テキストに基づいて字幕画面作成お
よびタイミング付与を行う自動字幕番組データ制作部
と、 作成された字幕番組データの編集および試写を行う字幕
番組編集・試写部と、 を備えたことを特徴とする半自動型字幕番組制作システ
ム。 - 【請求項2】 請求項1に記載の半自動型字幕制作シス
テムにおいて、 前記字幕テキスト書き起こし部におけるマンマシンイン
タフェースとなるメイン画面は、 現在作業中の映像を表示する映像表示エリアと、この映
像に対応する書き起こし中の字幕用テキストを表示する
字幕用テキスト表示エリアと、前記作業中の映像に対応
した一定間隔毎若しくはカット変わりなどの画像と、各
画像に対応する書き起こされた字幕用テキストと、各字
幕用テキストの書き起こしの基となる音声に関する波形
とがタイムライン上に一覧表示された一覧表示エリア
と、各エリアに対する制御エリアと、を少なくとも備
え、このメイン画面により作業者の字幕テキスト書き起
こし作業を支援する、 ことを特徴とする半自動型字幕番組制作システム。 - 【請求項3】 請求項1または2に記載の半自動型字幕
番組制作システムにおいて、 前記字幕番組編集・試写部におけるマンマシンインタフ
ェースとなるメイン画面は、 現在編集・試写中の映像を表示する映像表示エリアと、
この映像に対応する書き起し済の字幕用テキストを表示
する字幕用テキスト表示エリアと、前記編集・試写中の
映像に対応した一定間隔毎若しくはカット変わりなどの
画像と、各画像に対応する書き起こされた字幕用テキス
トと、各字幕用テキストの書き起こしの基となった音声
に関する波形とがタイムライン上に一覧表示された一覧
表示エリアと、各エリアに対する制御エリアと、を少な
くとも備え、このメイン画面により作業者の字幕テキス
ト編集・試写作業を支援する、ことを特徴とする半自動
型字幕番組制作システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002019209A JP4124416B2 (ja) | 2002-01-28 | 2002-01-28 | 半自動型字幕番組制作システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002019209A JP4124416B2 (ja) | 2002-01-28 | 2002-01-28 | 半自動型字幕番組制作システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003224774A true JP2003224774A (ja) | 2003-08-08 |
JP4124416B2 JP4124416B2 (ja) | 2008-07-23 |
Family
ID=27743176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002019209A Expired - Lifetime JP4124416B2 (ja) | 2002-01-28 | 2002-01-28 | 半自動型字幕番組制作システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4124416B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012142881A (ja) * | 2011-01-06 | 2012-07-26 | Kddi Corp | 字幕編集装置、字幕編集方法、及びコンピュータプログラム |
JP2014022758A (ja) * | 2012-07-12 | 2014-02-03 | Sony Corp | 情報処理装置、情報処理方法、表示制御装置および表示制御方法 |
US8706487B2 (en) | 2006-12-08 | 2014-04-22 | Nec Corporation | Audio recognition apparatus and speech recognition method using acoustic models and language models |
JP2020010136A (ja) * | 2018-07-05 | 2020-01-16 | 富士ゼロックス株式会社 | 情報処理装置およびプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1091212C (zh) * | 1997-01-29 | 2002-09-18 | 富士乌兹克斯株式会社 | 内燃机中的空心气门 |
-
2002
- 2002-01-28 JP JP2002019209A patent/JP4124416B2/ja not_active Expired - Lifetime
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8706487B2 (en) | 2006-12-08 | 2014-04-22 | Nec Corporation | Audio recognition apparatus and speech recognition method using acoustic models and language models |
JP2012142881A (ja) * | 2011-01-06 | 2012-07-26 | Kddi Corp | 字幕編集装置、字幕編集方法、及びコンピュータプログラム |
JP2014022758A (ja) * | 2012-07-12 | 2014-02-03 | Sony Corp | 情報処理装置、情報処理方法、表示制御装置および表示制御方法 |
JP2020010136A (ja) * | 2018-07-05 | 2020-01-16 | 富士ゼロックス株式会社 | 情報処理装置およびプログラム |
JP7176257B2 (ja) | 2018-07-05 | 2022-11-22 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4124416B2 (ja) | 2008-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1152335C (zh) | 用于创建多媒体文件的创作设备和创作方法 | |
US6185538B1 (en) | System for editing digital video and audio information | |
US5204969A (en) | Sound editing system using visually displayed control line for altering specified characteristic of adjacent segment of stored waveform | |
US7362946B1 (en) | Automated visual image editing system | |
US6970639B1 (en) | System and method for editing source content to produce an edited content sequence | |
US5467288A (en) | Digital audio workstations providing digital storage and display of video information | |
US6438313B2 (en) | Edited-list creating apparatus, editing apparatus and editing method | |
US5151998A (en) | sound editing system using control line for altering specified characteristic of adjacent segment of the stored waveform | |
EP1083568A2 (en) | Image identification apparatus and method of identifying images | |
JP4020083B2 (ja) | 書き起こしテキスト作成支援システムおよびプログラム | |
GB2326516A (en) | Method of and apparatus for editing audio or audio-visual recordings | |
JP2005129971A (ja) | 半自動型字幕番組制作システム | |
US20020136529A1 (en) | Caption subject matter creating system, caption subject matter creating method and a recording medium in which caption subject matter creating program is stored | |
JP4124416B2 (ja) | 半自動型字幕番組制作システム | |
JP4496358B2 (ja) | オープンキャプションに対する字幕表示制御方法 | |
JP2003223199A (ja) | 字幕用書き起こしテキストの作成支援システム及び半自動型字幕番組制作システム | |
JP2003216200A (ja) | 字幕用書き起こしテキストの作成支援システム及び半自動型字幕番組制作システム | |
GB2294355A (en) | Voice or text labelling system for a digital audiovisual workstation | |
JP2002008052A (ja) | プレゼンテーションシステムおよび記録媒体 | |
JP3969570B2 (ja) | 逐次自動字幕制作処理システム | |
JP2003224807A (ja) | 字幕番組編集支援システムおよび半自動型字幕番組制作システム | |
JP4459077B2 (ja) | ナレーション支援装置、その原稿編集方法およびプログラム | |
JP3841815B2 (ja) | 映像デ―タ編集方法 | |
JP2001169237A (ja) | 動画編集再生装置 | |
JP2000083194A (ja) | 映像デ―タ編集方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20040513 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040517 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20040903 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20041213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080324 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080415 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080501 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4124416 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110516 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120516 Year of fee payment: 4 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130516 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140516 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |