JP6917561B2 - 字幕修正装置、字幕修正方法、及び、コンピュータプログラム - Google Patents

字幕修正装置、字幕修正方法、及び、コンピュータプログラム Download PDF

Info

Publication number
JP6917561B2
JP6917561B2 JP2019205066A JP2019205066A JP6917561B2 JP 6917561 B2 JP6917561 B2 JP 6917561B2 JP 2019205066 A JP2019205066 A JP 2019205066A JP 2019205066 A JP2019205066 A JP 2019205066A JP 6917561 B2 JP6917561 B2 JP 6917561B2
Authority
JP
Japan
Prior art keywords
subtitle
character data
output
control unit
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019205066A
Other languages
English (en)
Other versions
JP2021078060A (ja
Inventor
修 吉村
修 吉村
鈴木 一
一 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2019205066A priority Critical patent/JP6917561B2/ja
Publication of JP2021078060A publication Critical patent/JP2021078060A/ja
Application granted granted Critical
Publication of JP6917561B2 publication Critical patent/JP6917561B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本開示は、字幕修正装置、字幕修正方法、及び、コンピュータプログラムに関する。
従来、テレビ番組の音声を字幕化して表示することが行われている。音声の字幕化には、音声を認識して文字データに変換する音声認識技術が用いられる。しかし、音声認識技術によって変換された文字データには誤りが存在し得る。よって、字幕として出力される前に、文字データを修正する作業が行われる。特許文献1には、音声認識技術によって変換された文字データを修正するための装置が開示されている。
特開2004−151614号公報
しかしながら、特許文献1に開示の装置では、文字データの字幕としての出力及び表示を制御できない。
本開示は、文字データの字幕としての出力及び表示を制御できる字幕修正装置、方法及びコンピュータプログラムを提供することにある。
本開示に係る字幕修正装置は、ユーザからの操作を検出する操作部と、字幕向けの文字データを修正するための修正領域を表示する表示部と、前記字幕の出力先に一度に表示される前記字幕に対応する文字データの範囲を示す字幕出力範囲を前記修正領域に表示させ、前記操作部を通じて前記字幕の出力操作を検出した場合、前記字幕出力範囲の文字データを、前記字幕として出力する制御部と、を備える。
本開示に係る字幕修正方法は、装置が、字幕向けの文字データを修正するための修正領域を表示部に表示し、前記字幕の出力先に一度に表示される前記字幕に対応する文字データの範囲を示す字幕出力範囲を前記修正領域に表示させ、操作部を通じて前記字幕の出力操作を検出した場合、前記字幕出力範囲の文字データを、前記字幕として出力する。
なお、これらの包括的又は具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム又は記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。
本開示によれば、文字データの字幕としての出力及び表示を制御できる。
一実施の形態に係る字幕生成システムの構成を示す図 一実施の形態に係る字幕修正装置の構成を示す図 修正領域の一例を示す図 字幕出力範囲のすべての文字データをテレビ画面の上部に字幕として表示する字幕出力操作を説明するための図 字幕出力範囲のすべての文字データをテレビ画面の下部に字幕として表示する字幕出力操作を説明するための図 修正領域における文字データの繰り上げ動作の一例を説明するための図 字幕出力範囲の途中までの文字データをテレビ画面の上部に字幕として表示する字幕出力操作を説明するための図 字幕出力範囲の途中までの文字データをテレビ画面の下部に字幕として表示する字幕出力操作を説明するための図 修正領域における単語の削除操作の一例を説明するための図 修正領域における文字データの改行操作の一例を説明するための図 修正領域における読点の挿入操作の一例を説明するための図 修正領域における読点を句点に修正する操作の一例を説明するための図 修正領域における文字データの選択操作の一例を説明するための図 字幕修正装置における操作処理の一例を示すフローチャート 図12におけるタッチパッド操作処理の一例を示すフローチャート 図13におけるドラッグ操作処理の一例を示すフローチャート 図14における未選択状態のドラッグ操作処理の一例を示すフローチャート 図14における選択状態のドラッグ操作処理の一例を示すフローチャート 図13におけるタップ操作処理の一例を示すフローチャート 図13における長押し操作処理の一例を示すフローチャート 図12におけるキーボード操作処理の一例を示すフローチャート 図19における未選択状態のキーボード操作処理の一例を示すフローチャート 図19における選択状態のキーボード操作処理の一例を示すフローチャート
以下、図面を適宜参照して、本開示の実施の形態について、詳細に説明する。ただし、必要以上に詳細な説明は省略する場合がある。例えば、すでによく知られた事項の詳細説明及び実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。なお、添付図面及び以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の記載の主題を限定することは意図されていない。
(一実施の形態)
<システム構成>
図1は、一実施の形態に係る字幕生成システムの構成を示す図である。字幕生成システムは、テレビ番組内の音声に対応する字幕を生成するためのシステムである。
図1に示すように、字幕生成システムは、音声再生装置21、マイク22、字幕生成装置23、字幕合成装置24、放送装置25、アーカイブ装置26、及び、字幕修正装置100を含む。
音声再生装置21は、テレビ番組データ31内の音声データを再生する装置である。テレビ番組データ31は、生放送番組のデータであってもよいし、収録済み番組のデータであってもよい。
リスピーカー11は、音声再生装置21によって再生された音声データを聞きながら、その聞いた音声(言葉)をマイク22に向かって発声する。以下、リスピーカー11が発声し、マイク22によって集音された音声データを、リスピーク音声データ32という。マイク22は、リスピーク音声データ32を、字幕生成装置23に送信する。
字幕生成装置23は、マイク22から入力されたリスピーク音声データ32に対して音声認識技術を適用し、リスピーク音声データ32に対応する文字データを生成する。リスピーク音声データ32は、上述のとおり、リスピーカー11によって発声されたものであるため、テレビ番組データ31内の音声データと比べて雑音が少ない。よって、字幕生成装置23における音声認識の精度が向上する。しかしながら、精度が向上しても、音声認識には誤りが生じ得る。
字幕修正装置100は、字幕生成装置23と連携して、字幕生成装置23が音声認識技術によって生成した文字データを修正する操作(以下「文字データ修正操作」という)を行うための装置である。また、字幕修正装置100は、字幕生成装置23と連携して、生成又は修正された文字データの少なくとも一部の文字データを字幕として出力する操作(以下「字幕出力操作」という)を行うための装置である。修正者12は、字幕修正装置100に対して、文字データ修正操作及び字幕出力操作を行う。
修正者12が字幕修正装置100に対して字幕出力操作を行った場合、字幕生成装置23は、文字データから字幕データ33を生成し、字幕合成装置24へ送信する。
字幕合成装置24は、テレビ番組データ31に対して、字幕生成装置23から受信した字幕データ33を合成し、放送データ34を生成する。放送データ34は、アーカイブ装置26に蓄積されてよい。また、放送データ34は、放送装置25によって放送されてよい。
テレビ受像機27は、受信した放送データ34をデコードし、テレビ番組及び字幕をテレビ画面に表示する。テレビ画面に一度に表示される字幕の1行あたりの文字数の上限と行数の上限とは、予め定められてよい。例えば、字幕の1行あたりの文字数の上限は21文字、字幕の行数の上限は2行と定められてよい。また、字幕データ33には、テレビ画面における字幕の表示位置(例えばテレビ画面の上部または下部)を示す情報(以下「字幕位置情報」という)が含まれてよい。修正者12は、字幕修正装置100に対する字幕出力操作を通じて、字幕位置情報を指示できてよい。
なお、図1に示す字幕生成システムの構成は一例であり、字幕生成システムは、図1とは異なる構成であってもよい。例えば、字幕生成装置23には、リスピーク音声データ32に代えて、テレビ番組データ31内の音声データが直接入力されてもよい。この場合、字幕生成システムは、リスピーカー11及びマイク22を含まない構成であってもよい。
以下、字幕修正装置100について、さらに説明する。
<字幕修正装置の構成>
図2は、一実施の形態に係る字幕修正装置100の構成を示す図である。
字幕修正装置100は、メモリ101、ストレージ102、制御部103、通信部104、及び表示部105を備える。また、字幕修正装置100は、操作部106の一例であるタッチパッド106A、キーボード106B及びマウス106Cのうちの少なくとも1つを備える。また、字幕修正装置100は、これらの要素101〜106を双方向通信可能に接続するバス107を備える。なお、字幕修正装置100は、表示部105及びタッチパッド106Aが一体化されたタッチパネル108を備えてもよい。
メモリ101は、字幕修正装置100が有する機能に関するコンピュータプログラム及びデータを記憶する装置である。メモリ101は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)又はこれらの組み合わせによって構成される。
ストレージ102は、不揮発性記憶媒体であり、字幕修正装置100が有する機能に関するコンピュータプログラム及びデータを格納する装置である。ストレージ102は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、及び/又はフラッシュメモリによって構成される。
制御部103は、メモリ101又はストレージ102から読み出したコンピュータプログラム及び/又は予め組み込まれた処理を実行し、字幕修正装置100が有する機能を実現する装置である。制御部103は、プロセッサ、コントローラ、CPU(Central Processing Unit)、集積回路、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、又はFPGA(Field-Programmable Gate Array)といった他の用語に読み替えられてもよい。
通信部104は、通信ネットワーク又はケーブルを介した他の装置(例えば字幕生成装置23)とのデータの送受信を制御する装置である。通信部104は、通信装置、通信インタフェース又は通信モジュールといった他の用語に読み替えられてもよい。
表示部105は、字幕修正に関する画面(以下「字幕修正画面」という)を表示する装置である。表示部105は、例えば、液晶ディスプレイ又は有機ELディスプレイである。
タッチパッド106Aは、修正者12によるタッチ操作を検出する装置である。タッチパッド106Aは、検出したタッチ操作を、制御部103に通知する。
キーボード106Bは、修正者12によるキーの入力操作を検出する装置である。キーボード106Bは、検出したキー入力操作を、制御部103に通知する。
マウス106Cは、修正者12によるマウス106Cの操作を検出する装置である。マウス106Cは、検出したマウス操作を、制御部103に通知する。
<字幕修正画面>
図3は、修正領域の一例を示す図である。表示部105によって表示される字幕修正画面(図示しない)には、図3に示すような修正領域200が表示される。
修正領域200には、リスピーク音声データ32を音声認識した文字データが、単語に区切られて表示される。図3において、バー記号201は、文字データを構成する単語の区切りを示す。バー記号201は、字幕として出力されない。本開示における文字データは、当該単語の区切りを示すバー記号201を含まないとする。単語の区切りを示す記号は、バー記号201に限られず、例えば、スラッシュ記号又はセミコロン記号であってもよい。
修正領域200には、テレビ画面に表示される字幕と同一のレイアウトにて文字データが表示される。例えば、修正領域200における1行あたり文字数の上限は、字幕として表示される1行あたりの文字数の上限と同じである。例えば、字幕の1行あたりの文字数の上限が21文字である場合、修正領域200における1行あたりのバー記号201を含まない文字数の上限も21文字である。また、修正領域200の各行の文字データは、字幕の各行の文字データと同じである。このように、修正領域200に、テレビ画面に表示される字幕と同一のレイアウトにて文字データを表示することにより、修正者12は、文字データが字幕としてどのように表示されるかを考慮しながら、文字データを修正したり、字幕の出力を指示したりすることができる。
また、修正領域200には、テレビ画面に一度に表示される字幕に対応する文字データの範囲を示す字幕出力範囲202が表示される。例えば、テレビ画面に一度に表示される字幕の行数が2行の場合、字幕出力範囲202は、図3に示すように、修正領域200における上から2行分の範囲となる。字幕出力範囲202の態様は、修正領域200におけるそれ以外の範囲とは異なる態様で表示される。例えば、図3に示すように、字幕出力範囲202の態様は網掛けであってよい。ただし、字幕出力範囲202の態様は、図3の例に限られない。例えば、字幕出力範囲202の文字データの文字色及び/又は背景色が、それ以外の文字データの文字色及び/又は背景色と異なる態様であってもよい。これにより、修正者12は、修正領域200における何れの文字データが字幕として出力されるのかを、容易に認識できる。
<字幕出力操作>
次に、字幕出力範囲202のすべての文字データを字幕として出力する字幕出力操作の一例について説明する。図4Aは、字幕出力範囲202のすべての文字データを、テレビ画面の上部に字幕として表示する字幕出力操作を説明するための図である。図4Bは、字幕出力範囲202のすべての文字データを、テレビ画面の下部に字幕として表示する字幕出力操作を説明するための図である。図5は、修正領域における文字データの繰り上げ動作の一例を説明するための図である。
図4Aの上段に示すように、修正者12が、タッチパッド106Aを通じて、修正領域200に対して上方向のスワイプ操作を行った場合、制御部103は、字幕出力範囲202のすべての文字データをテレビ画面300の上部に字幕301Aとして表示させるための情報を生成し、字幕生成装置23に送信する。例えば、制御部103は、字幕出力範囲202のすべての文字データと、「上部」を示す字幕位置情報とを含む字幕出力情報を生成し、字幕生成装置23に送信する。字幕生成装置23は、受信した字幕出力情報に基づいて字幕データ33を生成し、字幕合成装置24へ出力する。なお、字幕生成装置23は、受信した字幕出力情報を字幕データ33として字幕合成装置24へ出力してもよい。これにより、図4Aの下段に示すように、字幕出力範囲202のすべての文字データが、字幕301Aとしてテレビ画面300の上部に表示される。
図4Bに示すように、修正者12が、タッチパッド106Aを通じて、修正領域200に対して下方向のスワイプ操作を行った場合、制御部103は、字幕出力範囲202のすべての文字データをテレビ画面300の下部に字幕301Bとして表示させるための情報を生成し、字幕生成装置23に送信する。例えば、制御部103は、字幕出力範囲202のすべての文字データと、「下部」を示す字幕位置情報とを含む字幕出力情報を生成し、字幕生成装置23に送信する。字幕生成装置23は、受信した字幕出力情報に基づいて字幕データ33を生成し、字幕合成装置24へ出力する。なお、字幕生成装置23は、受信した字幕出力情報を字幕データ33として字幕合成装置24へ出力してもよい。これにより、図4Bの下段に示すように、字幕出力範囲202のすべての文字データが、字幕301Bとしてテレビ画面300の下部に表示される。
制御部103は、字幕出力情報の送信後、図5に示すように、字幕出力範囲202の文字データを削除し、削除した文字データよりも後の文字データを繰り上げることにより、削除によって生じた空白を詰める。これにより、削除した文字データよりも後の文字データのうちの上段(例えば上から2行分)の文字データが、字幕出力範囲202に含まれる。したがって、修正者12は、修正領域200における何れの文字データが次の字幕として出力されるのかを、容易に認識できる。
このように、修正者12は、字幕出力指示と、字幕表示位置(つまりテレビ画面300における上部又は下部)の指定とを、1回のスワイプ操作で簡単かつ素早く行うことができる。
次に、字幕出力範囲202の途中までの文字データを字幕として出力する字幕出力操作の一例について説明する。図6Aは、字幕出力範囲202の途中までの文字データを、テレビ画面の上部に字幕として表示する字幕出力操作を説明するための図である。図6Bは、字幕出力範囲202の途中までの文字データを、テレビ画面の下部に字幕として表示する字幕出力操作を説明するための図である。
図6Aに示すように、修正者12が、タッチパッド106Aを通じて、字幕出力範囲202における1つの単語204をタップ操作した場合、制御部103は、タップされた単語204を選択状態に変更する。そして、単語204の選択状態において、修正者12が、タッチパッド106Aを通じて、修正領域200に対して上方向のスワイプ操作を行った場合、制御部103は、字幕出力範囲202の先頭の単語から当該選択状態の単語204までの区間の文字データ(以下「区間文字データ」という)205をテレビ画面300の上部に字幕301Aとして表示させるための情報を生成し、字幕生成装置23に送信する。例えば、制御部103は、字幕出力範囲202の区間文字データ205と、「上部」を示す字幕位置情報とを含む字幕出力情報を生成し、字幕生成装置23に送信する。字幕生成装置23は、受信した字幕出力情報に基づいて字幕データ33を生成し、字幕合成装置24へ出力する。なお、字幕生成装置23は、受信した字幕出力情報を字幕データ33として字幕合成装置24へ出力してもよい。
図6Bに示すように、修正者12が、タッチパッド106Aを通じて、字幕出力範囲202における1つの単語204をタップ操作した場合、制御部103は、タップされた単語204を選択状態に変更する。そして、単語204の選択状態において、修正者12が、タッチパッド106Aを通じて、修正領域200に対して下方向のスワイプ操作を行った場合、制御部103は、字幕出力範囲202の先頭の単語から当該選択状態の単語204までの区間文字データ205をテレビ画面300の下部に字幕301Bとして表示させるための情報を生成し、字幕生成装置23に送信する。例えば、制御部103は、字幕出力範囲202の区間文字データ205と、「下部」を示す字幕位置情報とを含む字幕出力情報を生成し、字幕生成装置23に送信する。字幕生成装置23は、受信した字幕出力情報に基づいて字幕データ33を生成し、字幕合成装置24へ出力する。なお、字幕生成装置23は、受信した字幕出力情報を字幕データ33として字幕合成装置24へ出力してもよい。
このように、修正者12は、字幕出力範囲202の途中までの文字データの字幕出力指示と、字幕表示位置(例えばテレビ画面300における上部又は下部)の指定とを、簡単な操作で素早く行うことができる。
なお、上述の字幕出力操作は、タッチパッド106Aに限らず、マウス106C及びキーボード106Bにも割り当てられてよい。例えば、マウス106Cの左ボタンを押しながらマウス106Cを上方向に移動させる操作は、上述のタッチパッド106Aにおける上方向のスワイプ操作に対応し、マウス106Cの左ボタンを押しながらマウス106Cを下方向に移動させる操作は、上述のタッチパッド106Aにおける下方向のスワイプ操作に対応してもよい。
また、マウス106Cで単語を左クリックする操作は、上述のタッチパッド106Aを通じて単語をタップする操作に対応してもよい。
また、キーボード106BのAltキー及び上矢印キーを押下する操作は、上述のタッチパッドにおける上方向のスワイプ操作に対応し、キーボード106BのAltキー及び下矢印キーを押下する操作は、上述のタッチパッド106Aにおける下方向のスワイプ操作に対応してもよい。また、カーソルが単語上にある状態でキーボード106BのShiftキーを押下する操作は、上述のタッチパッド106Aを通じて単語をタップする操作に対応してもよい。
このように、修正者12は、字幕出力範囲202に含まれる文字データの字幕出力と、当該出力される字幕のテレビ画面300における表示位置(例えばテレビ画面300の上部又は下部)とを、簡単な操作で指示できる。
<文字データ修正操作>
<<削除>>
図7は、修正領域における単語の削除操作の一例を説明するための図である。
図7に示すように、修正者12が、タッチパッド106Aを通じて、修正領域200における1つの単語204をタップ操作した場合、制御部103は、タップされた単語204を選択状態に変更する。そして、単語204の選択状態において、修正者12が、タッチパッド106Aを通じて、修正領域200に対して右方向のスワイプ操作を行った場合、制御部103は、選択状態の単語204を文字データから削除し、削除された単語よりも後の文字データを繰り上げることにより、削除によって生じた空白206を詰める。
<<改行>>
図8は、修正領域における文字データの改行操作の一例を説明するための図である。
図8に示すように、修正者12が、タッチパッド106Aを通じて、修正領域200における1つの単語204をタップ操作した場合、制御部103は、タップされた単語204を選択状態に変更する。そして、単語204の選択状態において、修正者12が、タッチパッド106Aを通じて、修正領域200に対して左方向のスワイプ操作を行った場合、制御部103は、選択状態の単語204の直後に改行207を挿入する。
<<句読点の挿入>>
図9は、修正領域における読点の挿入操作の一例を説明するための図である。
図9に示すように、修正者12が、タッチパッド106Aを通じて、修正領域200における1つの単語208を長押し操作した場合、制御部103は、長押しされた単語208の直後に読点209を挿入する。なお、読点209の代わりに、句点を挿入するように設定してもよい。この場合、制御部103は、長押しされた単語208の直後に句点を挿入する。
<<句読点の修正>>
図10は、修正領域における読点を句点に修正する操作の一例を説明するための図である。
図10に示すように、修正者12が、タッチパッド106Aを通じて、修正領域200における読点210を長押し操作した場合、制御部103は、長押しされた読点210を句点211に修正する。また、修正者12が、タッチパッド106Aを通じて、修正領域200における句点211を長押し操作した場合、制御部103は、長押しされた句点211を読点に修正する。
<文字データ選択操作>
図11は、修正領域における文字データの選択操作の一例を説明するための図である。
図11に示すように、修正者12が、タッチパッド106Aを通じて、修正領域200に対して、選択したい文字データの開始地点から終了地点までをドラッグ操作した場合、制御部103は、ドラッグ操作された開始地点から終了地点までの文字データ212を選択状態に変更する。この文字データ212の選択状態において、修正者12は、以下の(A1)〜(A5)の何れかの操作を実行できる。
(A1)選択状態の文字データ212の終了地点が字幕出力範囲202に存在し、かつ、修正者12が修正領域200に対して上方向のスワイプ操作を行った場合、制御部103は、字幕出力範囲202の先頭の単語から選択状態の文字データ212の最後尾の単語までの区間の文字データ(つまり区間文字データ)205と、「上部」を示す字幕位置情報とを含む字幕出力情報を生成し、字幕生成装置23に送信する。
(A2)選択状態の文字データ212の終了地点が字幕出力範囲202に存在し、かつ、修正者12が修正領域200に対して下方向のスワイプ操作を行った場合、制御部103は、字幕出力範囲202の区間文字データ205と、「下部」を示す字幕位置情報とを含む字幕出力情報を生成し、字幕生成装置23に送信する。
(A3)修正領域200において選択状態の文字データが存在し、かつ、修正者12が修正領域200に対して右方向のスワイプ操作を行った場合、制御部103は、修正領域200から選択状態の文字データ212を削除し、削除された文字データ212よりも後の文字データを繰り上げる。
(A4)修正領域200において選択状態の文字データ212が存在し、かつ、修正者12が修正領域200に対して左方向のスワイプ操作を行った場合、制御部103は、選択状態の文字データ212の直後に改行を挿入する。
(A5)修正領域200において選択状態の文字データ212が存在し、かつ、修正者12がキーボード106Bから文字を入力した場合、制御部103は、入力文字を、メモリ101に構成されたバッファ(図示しない)に蓄積する。その後、修正者12が、キーボード106BのEnterキーを押下した場合、制御部103は、修正領域200における選択状態の文字データ212を、バッファに蓄積された入力文字に置き換える。なお、バッファに入力文字が蓄積されている状態において、修正者12が、キーボード106BのESCキーを押下した場合、制御部103は、選択状態の文字データ212を非選択状態に変更し、バッファ内の入力文字のデータをクリアする。つまり、制御部103は、選択状態の文字データ212の修正をキャンセルする。
このように、修正者12は、修正領域200における文字データを簡単な操作で素早く修正することができる。
<フローチャート>
図12は、字幕修正装置における操作処理の一例を示すフローチャートである。なお、以下の説明ではマウス106Cの操作を省略するが、以下の説明におけるタッチパッド106Aの操作は、対応するマウス106Cの操作に読み替えることができる。
操作部106は、タッチパッド106A又はキーボード106Bの操作が検知されるまで待機する(S101:NO)。操作部106は、タッチパッド106A又はキーボード106Bの操作を検知した場合(S101:YES)、検知した操作の内容を示す操作情報を生成し、制御部103へ送信する(S102)。
制御部103は、受信した操作情報に基づいて、タッチパッド106A又はキーボード106Bの何れの装置が操作されたかを判定する(S103)。制御部103は、タッチパッド106Aが操作された場合(S103:タッチパッド)、タッチパッド操作処理(図13参照)を実行し、キーボード106Bが操作された場合(S102:キーボード)、キーボード操作処理(図19参照)を実行する。
図13は、図12におけるタッチパッド操作処理の一例を示すフローチャートである。
制御部103は、操作情報の種類が「ドラッグ操作」、「タップ操作」及び「長押し操作」のうちの何れであるかを判定する(S201)。
制御部103は、操作情報の種類が「ドラッグ操作」である場合(S201:ドラッグ)、ドラッグ操作処理(図14参照)を実行し、操作情報の種類が「タップ操作」である場合(S201:タップ)、タップ操作処理(図17参照)を実行し、操作情報の種類が「長押し操作」である場合(S201:長押し)、長押し操作処理(図18参照)を実行する。
図14は、図13におけるドラッグ操作処理の一例を示すフローチャートである。
制御部103は、修正領域200において、選択状態の文字データが存在するか否かを判定する(S211)。なお、選択状態の文字データは、選択状態の単語であってもよい(以下同様)。制御部103は、選択状態の文字データが存在しない場合(S211:NO)、未選択状態のドラッグ操作処理を実行する(図15参照)。制御部103は、選択状態の文字データが存在する場合(S211:YES)、選択状態のドラッグ操作処理を実行する(図16参照)。
図15は、図14における未選択状態のドラッグ操作処理の一例を示すフローチャートである。
制御部103は、操作情報の内容が「上方向のドラッグ操作」、「下方向のドラッグ操作」又は「その他のドラッグ操作」のうちの何れであるかを判定する(S220)。
制御部103は、操作情報の内容が「上方向のドラッグ操作」である場合(S220:上方向)、字幕出力範囲202の文字データと、「上部」を示す字幕位置情報とを含む字幕出力情報を生成し、字幕生成装置23へ送信する(S221)。そして、制御部103は、文字データを繰り上げ(S224)、本操作処理を終了する。なお、制御部103は、本操作処理の終了後、再び図12の操作処理を開始してよい(以下同様)。
制御部103は、操作情報の内容が「下方向のドラッグ操作」である場合(S220:下方向)、字幕出力範囲202の文字データと、「下部」を示す字幕位置情報とを含む字幕出力情報を生成し、字幕生成装置23へ送信する(S222)。そして、制御部103は、文字データを繰り上げ(S224)、本操作処理を終了する。
制御部103は、操作情報の内容が「その他のドラッグ操作」である場合(S220:他の方向)、文字データの選択を行い(S223)、本操作処理を終了する。
図16は、図14における選択状態のドラッグ操作処理の一例を示すフローチャートである。
制御部103は、操作情報の内容が「上方向のドラッグ操作」、「下方向のドラッグ操作」、「右方向のドラッグ操作」、及び、「左方向のドラッグ操作」のうちの何れであるかを判定する(S230)。
制御部103は、操作情報の内容が「上方向のドラッグ操作」である場合(S230:上方向)、字幕出力範囲202における先頭の単語から、選択状態の単語又は選択状態の文字データの最後尾の単語までの区間の文字データ(つまり区間文字データ)と、「上部」を示す字幕位置情報とを含む字幕出力情報を生成し、字幕生成装置23へ送信する(S231)。なお、当該S231は、区間文字データの最後尾の単語が字幕出力範囲202に存在する場合に実行されてよい。そして、制御部103は、文字データを繰り上げ(S240)、本操作処理を終了する。
制御部103は、操作情報の内容が「下方向のドラッグ操作」である場合(S230:下方向)、字幕出力範囲202における区間文字データと、「下部」を示す字幕位置情報とを含む字幕出力情報を生成し、字幕生成装置23へ送信する(S232)。なお、当該S232は、区間文字データの最後尾の単語が字幕出力範囲202に存在する場合に実行されてよい。そして、制御部103は、文字データを繰り上げ(S240)、本操作処理を終了する。
制御部103は、操作情報の内容が「右方向のドラッグ操作」である場合(S230:右方向)、修正領域200における文字データから、選択状態の文字データ又は単語を削除する(S233)。そして、制御部103は、文字データを繰り上げ(S240)、本操作処理を終了する。
制御部103は、操作情報の内容が「左方向のドラッグ操作」である場合(S230:左方向)、修正領域200において、選択状態の単語又は選択状態の文字データの最後尾の単語の直後に改行を挿入し(S234)、本操作処理を終了する。
図17は、図13におけるタップ操作処理の一例を示すフローチャートである。
制御部103は、修正領域200において、選択状態の文字データが存在するか否かを判定する(S300)。
制御部103は、選択状態の文字データが存在しない場合(S300:NO)、タップ操作の対象が単語であるか否かを判定する(S301)。制御部103は、タップ操作の対象が単語である場合(S301:YES)、タップ操作の対象の単語を選択状態に変更し(S302)、本操作処理を終了する。制御部103は、タップ操作の対象が単語でない場合(S301:NO)、本操作処理を終了する。
制御部103は、選択状態の文字データが存在する場合(S300:YES)、タップ操作の対象が、字幕修正画面に表示されている変換候補、変換履歴又はユーザ登録のワード(図示しない)、空白領域、及び、それ以外のうちの何れであるかを判定する(S310)。変換候補のワードは、選択状態の文字データ又は単語に対応する他の変換候補のワードである。変換履歴のワードは、過去に選択状態の文字データ又は単語に対して変換したワードである。ユーザ登録のワードは、あらかじめユーザによって登録されたワードである。
制御部103は、タップ操作の対象が変換候補、変換履歴又はユーザ登録のワードである場合(S310:変換候補、変換履歴又はユーザ登録のワード)、選択状態の文字データを、タップ操作の対象の変換候補、変換履歴又はユーザ登録のワードに置換し(S311)、本操作処理を終了する。
制御部103は、タップ操作の対象が空白領域である場合(S310:空白領域)、選択状態の文字データを非選択状態に変更し(S312)、本操作処理を終了する。
制御部103は、タップ操作の対象がそれ以外である場合(S310:それ以外)、本操作処理を終了する。
図18は、図13における長押し操作処理の一例を示すフローチャートである。
制御部103は、長押し操作の対象が、単語、句点若しくは読点、及び、それ以外のうちの何れであるかを判定する(S330)。
制御部103は、長押し操作の対象が単語である場合(S330:単語)、長押し操作の対象の単語の直後に句点又は読点を挿入し(S331)、本操作処理を終了する。
制御部103は、長押し操作の対象が句点若しくは読点である場合(S330:句点若しくは読点)、長押し操作の対象が句点の場合は読点に、長押し操作の対象が読点の場合は句点に修正し(S332)、本操作処理を終了する。
制御部103は、長押し操作の対象がそれ以外である場合(S330:それ以外)、本操作処理を終了する。
図19は、図12におけるキーボード操作処理の一例を示すフローチャートである。
制御部103は、選択状態の文字データが存在するか否かを判定する(S400)。制御部103は、選択状態の文字データが存在しない場合(S400:NO)、未選択状態のキーボード操作処理を実行する(図20参照)。制御部103は、選択状態の文字データが存在する場合(S400:YES)、選択状態のキーボード操作処理を実行する(図21参照)。
図20は、図19における未選択状態のキーボード操作処理の一例を示すフローチャートである。
制御部103は、操作情報の内容が、「Altキー+上矢印キー」、「Altキー+下矢印キー」、「Shiftキー」のうちの何れであるかを判定する(S410)。
制御部103は、操作情報の内容が「Altキー+上矢印キー」である場合(S410:Alt+上)、図15のS221及びS224と同様の処理を実行する(S411、S414)。そして、制御部103は、本操作処理を終了する。
制御部103は、操作情報の内容が「Altキー+下矢印キー」である場合(S410:Alt+下)、図15のS222及びS224と同様の処理を実行する(S412、S414)。そして、制御部103は、本操作処理を終了する。
制御部103は、操作情報の内容が「Shiftキー」である場合(S410:Shift)、カーソルが位置する単語を選択状態に変更する(S413)。そして、制御部103は、操作処理を終了する。
図21は、図19における選択状態のキーボード操作処理の一例を示すフローチャートである。
制御部103は、操作情報の内容が、「文字キー」、「ESCキー」、「Enterキー」のうちの何れであるかを判定する(S420)。
制御部103は、操作情報の内容が「文字キー」である場合(S420:文字キー)、選択状態の文字データに対する修正モードに移行し、入力文字をバッファに蓄積する(S421)。なお、編集モードにおいて連続して入力された文字は、順次バッファに蓄積される。そして、制御部103は、本操作処理を終了する。
制御部103は、操作情報の内容が「Enterキー」である場合(S420:Enterキー)、選択状態の文字データを、修正モードにてバッファに蓄積された入力文字に置換する(S422)。すなわち、制御部103は、修正モードにおける文字データの修正を確定する。そして、制御部103は、選択状態の文字データを非選択状態に変更し(S423)、本操作処理を終了する。
制御部103は、操作情報の内容が「ESCキー」である場合(S420:ESCキー)、選択状態の文字データを非選択状態に変更し(S423)、本操作処理を終了する。なお、制御部103は、上記の修正モードにて当該S423を実行した場合、修正モードをキャンセルする。
<変形例>
字幕修正装置100(制御部103)は、所定のモニタ装置(図示しない)に対して、テレビ画面300における上部及び下部の字幕の表示領域を示す情報を出力してもよい。字幕の表示領域を示す情報は、例えば、字幕の最大表示領域を示す枠として表示されてよい。モニタ装置は、修正者12が見ることができる場所に設置され、テレビ番組データ31の映像と上記の字幕の表示領域を示す情報とを表示してよい。これにより、修正者12は、モニタ装置に表示されたテレビ番組データ31の映像を見ながら、テレビ画面300の上部又は下部の何れに字幕を出力すればよいかを判断できる。
上述したタッチパッド106Aの操作において、左方向のドラッグ操作は右方向のドラッグ操作と入れ替えられてもよいし、長押し操作はダブルタップ操作と入れ替えられてもよい。また、上述したキーボード106Bの操作において、矢印キーと一緒に押下されるキーは、Altキーに限られず、どのようなキー(例えばCtrlキー)であってもよい。
(本開示のまとめ)
本開示に係る字幕修正装置(100)は、ユーザ(12)からの操作を検出する操作部(106)と、字幕向けの文字データを修正するための修正領域(200)に、画面(300)に表示される字幕と同一のレイアウトにて文字データを表示する表示部(105)と、操作部を通じて修正領域に対する字幕の出力操作を検出した場合、修正領域に表示されている文字データのうちの少なくとも一部の文字データを、字幕として出力する制御部(103)とを備える。ここで、同一のレイアウトとは、修正領域の1行あたりの文字数の上限が字幕の1行あたりの文字数の上限と同じであり、かつ、修正領域の各行の文字データが字幕の各行の文字データと同じであることであってよい。この構成により、ユーザは、文字データが字幕としてどのように表示されるかを考慮しながら、文字データを修正したり、字幕の出力を指示したりすることができる。
表示部は、修正領域において、字幕として出力される少なくとも一部の文字データを、他の文字データと区別可能な態様にて表示してよい。ここで、区別可能な態様とは、字幕として出力される少なくとも一部の文字データの文字色及び/又は背景色が、他の文字データの文字色及び/又は背景色と異なることであってよい。この構成により、ユーザは、修正領域における字幕として出力される少なくとも一部の文字データを、見た目で容易に認識できる。
制御部は、操作部を通じて検出された、修正領域の文字データに対する選択操作に基づいて、字幕として出力する少なくとも一部の文字データを決定してよい。この構成により、ユーザは、字幕として出力する少なくとも一部の文字データを、簡単な操作で選択できる。
制御部は、字幕の出力操作に応じて、出力する字幕の画面における表示位置を決定してよい。ここで、字幕の出力操作は、互いに異なる方向を有する複数の操作を含んでよい。例えば、制御部は、上方向を有する字幕の出力操作を検出した場合、出力する字幕の画面における表示位置を、当該画面における上部に決定し、下方向を有する字幕の出力操作を検出した場合、出力する字幕の画面における表示位置を、当該画面における下部に決定してよい。この構成により、ユーザは、字幕出力指示と、字幕表示位置(画面における上部又は下部)の指定とを、1回のスワイプ操作で簡単かつ素早く行うことができる。
制御部は、画面における字幕の表示領域を示す情報を、所定のモニタ装置に出力してよい。この構成により、ユーザは、モニタ装置に表示されたテレビ番組の映像を見ながら、画面の上部又は下部の何れに字幕を出力すればよいかを判断できる。
制御部は、操作部を通じて文字データに対する所定の操作を検出した場合、文字データの直後に句点又は読点を挿入してよい。この構成により、ユーザは、句点又は読点の挿入を容易に行うことができる。
以上、添付図面を参照しながら実施の形態について説明したが、本開示はかかる例に限定されない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例、修正例、置換例、付加例、削除例、均等例に想到し得ることは明らかであり、それらについても本開示の技術的範囲に属すると了解される。また、発明の趣旨を逸脱しない範囲において、上述した実施の形態における各構成要素を任意に組み合わせてもよい。
本開示は、字幕を生成、修正及び/又は出力する装置に利用可能である。
11 リスピーカー
12 修正者
21 音声再生装置
22 マイク
23 字幕生成装置
24 字幕合成装置
25 放送装置
26 アーカイブ装置
27 テレビ受像機
31 テレビ番組データ
32 リスピーク音声データ
33 字幕データ
34 放送データ
100 字幕修正装置
101 メモリ
102 ストレージ
103 制御部
104 通信部
105 表示部
106 操作部
106A タッチパッド
106B キーボード
106C マウス
107 バス
108 タッチパネル
200 修正領域
201 バー記号
202 字幕出力範囲
212 文字データ
300 テレビ画面
301A、301B 字幕

Claims (12)

  1. ユーザからの操作を検出する操作部と、
    字幕向けの文字データを修正するための修正領域を表示する表示部と、
    前記字幕の出力先に一度に表示される前記字幕に対応する文字データの範囲を示す字幕出力範囲を前記修正領域に表示させ、前記操作部を通じて前記字幕の出力操作を検出した場合、前記字幕出力範囲の文字データを、前記字幕として出力する制御部と、
    を備える、字幕修正装置。
  2. 前記字幕出力範囲は、1行あたりの文字数の上限が前記字幕の1行あたりの文字数の上限と同じであり、かつ、各行の文字データが前記字幕の各行の文字データと同じである、
    請求項1に記載の字幕修正装置。
  3. 前記字幕出力範囲は、前記修正領域内に存在し、
    前記修正領域は、前記字幕出力範囲を超えて文字データを表示する、
    請求項1に記載の字幕修正装置。
  4. 前記字幕出力範囲と前記修正領域のうち前記字幕出力範囲を除く範囲は、区別可能な態様にて表示される、
    請求項に記載の字幕修正装置。
  5. 前記制御部は、前記操作部を通じて検出された、前記修正領域の前記文字データに対する選択操作に基づいて、前記字幕として出力する前記少なくとも一部の文字データを決定する、
    請求項1に記載の字幕修正装置。
  6. 前記制御部は、前記字幕の出力操作に応じて、出力する前記字幕の画面における表示位置を決定する、
    請求項1に記載の字幕修正装置。
  7. 前記字幕の出力操作は、互いに異なる方向を有する複数の操作を含む、
    請求項6に記載の字幕修正装置。
  8. 前記制御部は、
    上方向を有する前記字幕の出力操作を検出した場合、出力する前記字幕の前記画面における表示位置を、当該画面における上部に決定し、
    下方向を有する前記字幕の出力操作を検出した場合、出力する前記字幕の前記画面における表示位置を、当該画面における下部に決定する、
    請求項7に記載の字幕修正装置。
  9. 前記制御部は、前記出力先に表示される映像と前記字幕の表示領域を示す情報を、所定のモニタ装置に表示させる、
    請求項1に記載の字幕修正装置。
  10. 前記制御部は、前記操作部を通じて前記文字データに対する所定の操作を検出した場合、前記文字データの直後に句点又は読点を挿入する、
    請求項1に記載の字幕修正装置。
  11. 装置が、
    字幕向けの文字データを修正するための修正領域を表示部に表示し、
    前記字幕の出力先に一度に表示される前記字幕に対応する文字データの範囲を示す字幕出力範囲を前記修正領域に表示させ、操作部を通じて前記字幕の出力操作を検出した場合、前記字幕出力範囲の文字データを、前記字幕として出力する、
    字幕修正方法。
  12. 請求項11に記載の字幕修正方法を、コンピューターに実行させるためのコンピュータプログラム。
JP2019205066A 2019-11-12 2019-11-12 字幕修正装置、字幕修正方法、及び、コンピュータプログラム Active JP6917561B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019205066A JP6917561B2 (ja) 2019-11-12 2019-11-12 字幕修正装置、字幕修正方法、及び、コンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019205066A JP6917561B2 (ja) 2019-11-12 2019-11-12 字幕修正装置、字幕修正方法、及び、コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2021078060A JP2021078060A (ja) 2021-05-20
JP6917561B2 true JP6917561B2 (ja) 2021-08-11

Family

ID=75898495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019205066A Active JP6917561B2 (ja) 2019-11-12 2019-11-12 字幕修正装置、字幕修正方法、及び、コンピュータプログラム

Country Status (1)

Country Link
JP (1) JP6917561B2 (ja)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3136638B2 (ja) * 1991-03-20 2001-02-19 ソニー株式会社 情報信号再生装置
JP3795692B2 (ja) * 1999-02-12 2006-07-12 マイクロソフト コーポレーション 文字処理装置および方法
JP3986009B2 (ja) * 2002-11-01 2007-10-03 日本放送協会 文字データ修正装置、その方法及びそのプログラム、並びに、字幕の生成方法
JP5054711B2 (ja) * 2009-01-29 2012-10-24 日本放送協会 音声認識装置および音声認識プログラム
CN105955617B (zh) * 2011-06-03 2019-07-12 谷歌有限责任公司 用于选择文本的手势
JP2014149612A (ja) * 2013-01-31 2014-08-21 Nippon Hoso Kyokai <Nhk> 音声認識誤り修正装置およびそのプログラム
JP6095553B2 (ja) * 2013-11-07 2017-03-15 日本電信電話株式会社 情報表示装置、方法及びプログラム
JP2019148681A (ja) * 2018-02-27 2019-09-05 富士通株式会社 テキスト修正装置、テキスト修正方法およびテキスト修正プログラム

Also Published As

Publication number Publication date
JP2021078060A (ja) 2021-05-20

Similar Documents

Publication Publication Date Title
JP2008176658A (ja) 表示制御装置および方法、並びにプログラム
JP4020083B2 (ja) 書き起こしテキスト作成支援システムおよびプログラム
JP4716205B1 (ja) オブジェクト画像表示装置、オブジェクト画像表示方法、オブジェクト画像表示プログラム
JP2011211481A (ja) 動画再生装置
JP2014030153A (ja) 情報処理装置及び情報処理方法、並びにコンピューター・プログラム
JP4532786B2 (ja) 画像処理装置及びその方法
JP5664055B2 (ja) 映像再生装置及び映像再生プログラム
JP5135413B2 (ja) 映像信号処理装置及びその制御方法
JP6917561B2 (ja) 字幕修正装置、字幕修正方法、及び、コンピュータプログラム
JP7447422B2 (ja) 情報処理装置およびプログラム
US20210073479A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2022036352A (ja) 表示制御装置、及び表示制御方法
JPWO2011016335A1 (ja) コンテンツ通知装置、通知方法、プログラム
JP2020095689A5 (ja)
US20090183118A1 (en) Method and apparatus for displaying input element selection information
JP2008061020A (ja) 番組表表示装置
JP6191968B2 (ja) データ処理装置と、そのプログラム
JP4333560B2 (ja) テレビ放送記録再生装置
JP6569953B2 (ja) 電子機器及び電子機器の操作表示方法
KR101074018B1 (ko) 학습 보조 장치
JP4638318B2 (ja) リモートコントロールシステムおよびリモートコントロールシステムで用いられる装置
JP2007142923A (ja) 電子番組ガイド表示装置および表示方法
JP2006228329A (ja) 再生装置、再生システム、送出装置及びコンピュータプログラム
JP4515820B2 (ja) 情報表示装置
JP2004080276A (ja) Dvd再生装置及びその画面表示方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200708

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200708

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200804

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200825

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210630

R151 Written notification of patent or utility model registration

Ref document number: 6917561

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151