JP6926175B2 - 表示支援装置、方法およびプログラム - Google Patents
表示支援装置、方法およびプログラム Download PDFInfo
- Publication number
- JP6926175B2 JP6926175B2 JP2019215343A JP2019215343A JP6926175B2 JP 6926175 B2 JP6926175 B2 JP 6926175B2 JP 2019215343 A JP2019215343 A JP 2019215343A JP 2019215343 A JP2019215343 A JP 2019215343A JP 6926175 B2 JP6926175 B2 JP 6926175B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- character string
- divided character
- role
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
上述のように字幕表示する際に、内容の進行とともに字幕が順次切り替わったり、既に表示されている古い字幕が新たに表示される字幕によって少しずつ画面外へ押し出されたりするような表示を行う場合、利用者が字幕を見ることができる時間は限られる。そのため、字幕の内容を明確にしたり翻訳の質を高めたりするために、字幕表示される音声認識結果または翻訳結果の文を分割する技術がある。
第1の実施形態に係る表示支援装置について図1のブロック図を参照して説明する。 第1の実施形態に係る表示支援装置100は、取得部101、第1処理部102、第2処理部103および表示制御部104を含む。
形態素解析には、CKY法や最長一致法といった一般的なあらゆる形態素解析の技術を用いることができる。なお、取得部101で取得した入力文字列に既に形態素解析結果に関する情報が付与されている場合には、第1処理部102は形態素解析を行わなくともよい。
図2に示すテーブル200には、第1言語単位検出パターン201と役割ラベル202とがそれぞれ対応付けられて格納される。
第1処理部102により、図3に示すような分割文字列301から分割文字列310までと、それぞれに付与される役割ラベル202との処理結果を得ることができる。具体的には、分割文字列301「えー/まず/最初/に」は、テーブル200を参照することにより第1言語単位検出パターン201「文頭/最初/に」に一致しているので、分割文字列301には対応する役割ラベル202「[sentence adverb]」が付与される。
図4に示すテーブル400には、第2言語単位検出パターン401と末尾ラベル402とがそれぞれ対応付けられて格納される。
第2処理部103により、図5に示すような分割文字列501から分割文字列510までと、それぞれに付与される役割ラベル202と、末尾ラベル402との処理結果を得ることができる。
ステップS602では、表示制御部104が、表示における冒頭の区切り線を表示させる。
ステップS603は、表示制御部104が、設定されたインデントを行い、分割文字列を表示する。なお、初回の処理ではインデント数がゼロであるため、表示制御部104は分割文字列を行頭から表示させればよい。
ステップS605では、表示制御部104が、ステップS603で表示された分割文字列が節末であるかどうか、すなわち節末ラベルが付与されているかどうかを判定する。節末ラベルが付与されている場合、ステップS609に進み、節末ラベルが付与されていない場合、ステップS606に進む。
ステップS607では、表示制御部104が、次の分割文字列があるかどうかを判定する。次の分割文字列がある場合は、ステップS603に戻り、同様の処理を繰り返す。次の分割文字列がない場合は、ステップS610に進む。
ステップS608では、文末ラベルにより文が終了したことが分かるので、表示制御部104が、区切り線を表示させ、インデント数をゼロに設定する。その後ステップS603に戻り、同様の処理を繰り返す。
ステップS610では、表示制御部104が、区切り線を表示させる。以上で表示制御部104の動作を終了する。
ここでは、図5に示す第2処理部103の処理結果について表示制御が行われ、ディスプレイやスクリーンに字幕として表示される例を示す。分割文字列501については、最初の分割文字列であり、インデント数がゼロであるので、冒頭の区切り線700が表示された後に、分割文字列501が表示される(表示701)。分割文字列501は文末ラベルでも節末ラベルでもないので、ステップS606においてインデント数が1つインクリメントされ、インデント数が1となる。
ここで、分割文字列503は、節末ラベルが付与されているので、ステップS609における処理により、表示703の後に空行704が表示され、インデント数がゼロにリセットされる。
ここでは、説明の便宜上、図5に示す分割文字列501から分割文字列510までが1つの文節を形成すると仮定する。
第2の実施形態に係る表示支援装置について図9のブロック図を参照して説明する。 第2の実施形態に係る表示支援装置900は、取得部101、第1処理部102、第2処理部103、表示制御部104および表現変換部901を含む。
取得部101、第1処理部102および第2処理部103の動作は第1の実施形態と同様であるので、ここでの説明を省略する。
表示制御部104は、変換された分割文字列について表示制御を行う。
図10に示すテーブル1000には、変換対象パターン1001と変換パターン1002とが対応付けられて格納される。変換対象パターン1001は、変換対象となる文字列のパターンを示す。変換パターン1002は、変換対象パターン1001をどのように変換するかを示すパターンである。図10の例では、言い淀み、言い直し、言い誤り、およびフィラーなどを除去するためのパターンを変換パターン1002として用いる。
図11は、図5に示す第2処理部103の処理結果に対して、表現変換部901により分割文字列の表現が変換された例である。
また、分割文字列1107に関して、図5の例では、分割文字列507「まー/この/2/つ/の/方式/を/用い/て/おり/まし/て」であり、節末ラベルが付与されていたが、表現変換部901の処理により、「2/つ/の/方式/を/用い/て/い/ます」と変換され、節末ラベルから文末ラベルに変換される。
第3の実施形態に係る表示支援装置について図13のブロック図を参照して説明する。 第3の実施形態に係る表示支援装置1300は、取得部101、第1処理部102、第2処理部103、表示制御部104、表現変換部901および翻訳部1301を含む。 取得部101、第1処理部102、第2処理部103および表現変換部901の動作は第2の実施形態と同様であるので、ここでの説明を省略する。
図14は、図11に示す表現変換部901により表現が変換された分割文字列1101から分割文字列1110までに対して、機械翻訳処理が行われた例であり、ここでは、第1言語の日本語から第2言語の英語に翻訳する場合(日英翻訳という)を示す。分割文字列1401から分割1410までに示すように、分割文字列ごとに翻訳が可能となる。なお、既に付与されているラベルは、そのまま保持される。
図16Aは、日英翻訳の場合の機械翻訳例を示す。図16Bは、日中翻訳の場合の機械翻訳例を示す。
図17Aは、日中翻訳の場合の機械翻訳例を示す。図17Bは、日英翻訳の場合の機械翻訳例を示す。
翻訳部1301は、翻訳単位規則として翻訳文へ訳出しないキーワードを予め定めておき、図17Aおよび図17Bに示すような翻訳処理を行えばよい。
一方、図18Bに示すように、翻訳部1301は、日本語の分割文字列1801の「ので」を中国語に翻訳する場合は、
第4の実施形態に係る表示支援装置について図19のブロック図を参照して説明する。 第4の実施形態に係る表示支援装置1900は、取得部101、第1処理部102、第2処理部103、表示制御部104、表現変換部901、翻訳部1301および語順決定部1901を含む。
取得部101、第1処理部102、第2処理部103、表現変換部901および翻訳部1301の動作は第3の実施形態と同様であるので、ここでの説明を省略する。
表示制御部104は、並び替えられた分割文字列について表示制御を行う。
図20に示す語順決定規則のテーブル2000は、第1言語の語順パターン2001と第2言語の語順パターン2002とを対応付けて格納する。図20の例では、第1言語が日本語であり、第2言語が英語である例を示す。ここでは、分割文字列に付与される役割ラベルの順序が英語の語順として自然な順序となるような役割ラベルの順序で決定される。
語順を並び替える前の上述した図14の例では、第2言語単位中の分割文字列1401から分割文字列1403の順序が、「first[sentence adverb]」、「about machine translation [object]」、「we will introduce[predicate]<<節末>>」である。
図22に示すように語順を変更した後は、翻訳文の表示順序が[first][we will introduce][about machine translation]の語順となるので、第2言語の文法として自然な順序で翻訳文が表示される。
第5の実施形態では、第1言語の話者が複数である場合を想定する。
第5の実施形態に係る表示支援装置は、上述の実施形態のいずれか1つに示す表示支援装置を用いて実現される。
図23に示すように、役割ラベル202、末尾ラベル402に加えて、話者ラベル2300が付与される。
話者ラベルの決定方法は、例えば取得部101が取得した話者情報に基づいて、予めユーザの識別情報(IPアドレスや、ユーザIDが含まれるユーザの識別情報など)が得られる場合は、識別情報に従って識別してもよいし、話者A、話者Bなど、異なる話者情報であることが区別できるラベルを付与してもよい。
ステップS601、ステップS603からステップS607まで、およびステップS609の処理は、上述の実施形態と同様であるので、説明を省略する。
ステップS2402では、表示制御部104が、分割文字列に文末ラベルが付与されているので、現在の吹き出しを終了し、インデント数をゼロに設定する。また、ステップS2401に戻り、同様の処理を繰り返す。これにより、1つの文が、1つの吹き出しで表現されることになる。
ステップS2403では、全ての分割文字列について処理が終了したので、吹き出しを終了する。また、ステップS2401に戻り、同様の処理を繰り返す。
図25は、図23に示す第2処理部103の処理結果に対して表示制御を行った例である。話者Aの発言については吹き出し2501、話者Bの発言については吹き出し2502、話者Cの発言については吹き出し2503といったように、話者ごと、さらに文ごとに吹き出しが表示されることとなり、字幕の視認性を向上させることができる。
第5の実施形態の第1の変形例に係る表示制御部104の動作について図26のフローチャートを参照して説明する。
ステップS604、ステップS605、ステップS607、ステップS2401およびステップS2403の処理は、上述の実施形態と同様であるので説明を省略する。
ステップS2602では、表示制御部104が、現在の吹き出しを終了し、ステップS2401に戻り同様の処理を繰り返す。
ステップS2603では、表示制御部104が、空行を表示し、ステップS2601に戻り同様の処理を繰り返す。
図27に示すように、吹き出し内において分割文字列が囲み2701で表示されるので、字幕の視認性を向上させることができる。
第5の実施形態の第2の変形例について図28のフローチャートを参照して説明する。 ステップS603からステップS605まで、ステップS607、ステップS2401、ステップS2403およびステップS2603の処理は、上述の実施形態と同様であるので説明を省略する。
ステップS2802では、表示制御部104が、分割文字列の末尾に読点を表示し、現在の吹き出しを終了したのち、ステップS2401に戻り同様の処理を繰り返す。
図29においても、図27と同様に、吹き出し内において分割文字列が句読点で表示されるので、字幕の視認性を向上させることができる。
図30は、図23の分割文字列2309が、表現変換部901により変換され、併せて付与されていたラベルが節末ラベルから文末ラベルに付け替えられた場合である。表示制御部104は、分割文字列3001の文字列の色を変更する。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
Claims (11)
- 文字列を取得する取得部と、
前記文字列を意味のまとまりを表す単位である第1単位で分割し、複数の分割文字列を生成する第1処理部と、
前記複数の分割文字列のうちの第1分割文字列にそれぞれ、分割文字列の前記文字列における役割を示す役割ラベルを付与する第1付与部と、
前記文字列について前記第1単位よりも大きい単位である第2単位を検出する第2処理部と、
前記複数の分割文字列のうちの、前記第2単位の末尾にある第2分割文字列に末尾ラベルを付与する第2付与部と、
前記複数の分割文字列を表示させる場合に、分割文字列ごとに前記末尾ラベルが付与されているかどうかと、前記役割ラベルが示す前記文字列における役割とに基づいて前記第1単位および前記第2単位を区別し、かつ分割文字列間の関係を区別する表示制御を行う表示制御部と、を具備し、
前記役割ラベルは前記第1分割文字列の役割を表現し、前記役割は、第1単位のうちの1つとして使用されるポーズ情報と、第1単位のうちの1つとして使用される確定情報と、を含み、
前記第2処理部は、前記役割ラベルと、前記ポーズ情報または前記確定情報との並びを検出し、節末と文末のうちの1つを決定する表示支援装置。 - 変換規則に基づいて、前記分割文字列の表現を別の表現に変換する変換部をさらに具備し、
前記表示制御部は、変換された前記分割文字列について表示制御を行う請求項1に記載の表示支援装置。 - 前記表示制御部は、前記複数の分割文字列を表示させる場合に、ある分割文字列に続く次の分割文字列をインデントして表示させる処理を行い、該次の分割文字列が前記第2単位の末尾に位置する場合、該次の分割文字列を表示させた後に空行を表示させる処理を行う請求項1または請求項2に記載の表示支援装置。
- 前記複数の分割文字列を第1言語から第2言語に機械翻訳する翻訳部をさらに具備し、
前記表示制御部は、機械翻訳された分割文字列について表示制御を行う請求項1から請求項3のいずれか1項に記載の表示支援装置。 - 前記第2言語の語順決定規則に基づいて、翻訳処理された前記複数の分割文字列の表示順序を決定する決定部をさらに具備し、
前記表示制御部は、前記表示順序が決定された分割文字列について表示制御を行う請求項4に記載の表示支援装置。 - 前記文字列は、音声認識結果の文字列である請求項1から請求項5のいずれか1項に記載の表示支援装置。
- 前記第1単位は句であり、前記第2単位は節または文である請求項1から請求項6のいずれか1項に記載の表示支援装置。
- 前記第1単位は単文であり、前記第2単位は重文である請求項1から請求項6のいずれか1項に記載の表示支援装置。
- 前記取得部は、話者ごとの話者情報をさらに取得し、
前記表示制御部は、前記話者ごとに区別して表示制御を行う請求項1から請求項8のいずれか1項に記載の表示支援装置。 - 取得部が、文字列を取得し、
第1処理部が、前記文字列を意味のまとまりを表す単位である第1単位で分割し、複数の分割文字列を生成し、
第1付与部が、前記複数の分割文字列のうちの第1分割文字列にそれぞれ、分割文字列の前記文字列における役割を示す役割ラベルを付与し、
第2処理部が、前記文字列について前記第1単位よりも大きい単位である第2単位を検出し、
第2付与部が、前記複数の分割文字列のうちの、前記第2単位の末尾にある第2分割文字列に末尾ラベルを付与し、
表示制御部が、前記複数の分割文字列を表示させる場合に、分割文字列ごとに前記末尾ラベルが付与されているかどうかと、前記役割ラベルが示す前記文字列における役割とに基づいて前記第1単位および前記第2単位を区別し、かつ分割文字列間の関係を区別する表示制御を行い、
前記役割ラベルは前記第1文字列の役割を表現し、前記役割は、第1単位のうちの1つとして使用されるポーズ情報と、第1単位のうちの1つとして使用される確定情報と、を含み、
前記第2単位を検出することは、前記役割ラベルと、前記ポーズ情報または前記確定情報との並びを検出し、節末と文末のうちの1つを決定する表示支援方法。 - コンピュータを、
文字列を取得する取得手段と、
前記文字列を意味のまとまりを表す単位である第1単位で分割し、複数の分割文字列を生成する第1処理手段と、
前記複数の分割文字列のうちの第1分割文字列にそれぞれ、分割文字列の前記文字列における役割を示す役割ラベルを付与する第1付与手段と、
前記文字列について前記第1単位よりも大きい単位である第2単位を検出する第2処理手段と、
前記複数の分割文字列のうちの、前記第2単位の末尾にある第2分割文字列に末尾ラベルを付与する第2付与手段と、
前記複数の分割文字列を表示させる場合に、分割文字列ごとに前記末尾ラベルが付与されているかどうかと、前記役割ラベルが示す前記文字列における役割とに基づいて前記第1単位および前記第2単位を区別し、かつ分割文字列間の関係を区別する表示制御を行う表示制御手段として機能させるためのプログラムであって、
前記役割ラベルは前記第1文字列の役割を表現し、前記役割は、第1単位のうちの1つとして使用されるポーズ情報と、第1単位のうちの1つとして使用される確定情報と、を含み、
前記第2処理手段は、前記役割ラベルと、前記ポーズ情報または前記確定情報との並びを検出し、節末と文末のうちの1つを決定する表示支援プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019215343A JP6926175B2 (ja) | 2016-03-16 | 2019-11-28 | 表示支援装置、方法およびプログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016052394A JP2017167805A (ja) | 2016-03-16 | 2016-03-16 | 表示支援装置、方法およびプログラム |
JP2019215343A JP6926175B2 (ja) | 2016-03-16 | 2019-11-28 | 表示支援装置、方法およびプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016052394A Division JP2017167805A (ja) | 2016-03-16 | 2016-03-16 | 表示支援装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020057401A JP2020057401A (ja) | 2020-04-09 |
JP6926175B2 true JP6926175B2 (ja) | 2021-08-25 |
Family
ID=70107462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019215343A Active JP6926175B2 (ja) | 2016-03-16 | 2019-11-28 | 表示支援装置、方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6926175B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022030754A (ja) * | 2020-08-07 | 2022-02-18 | 株式会社東芝 | 入力支援システム、入力支援方法およびプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05151256A (ja) * | 1991-11-29 | 1993-06-18 | Hitachi Ltd | 機械翻訳方法および機械翻訳装置 |
JPH05189480A (ja) * | 1992-01-14 | 1993-07-30 | Nec Corp | 発話データ処理装置 |
JPH09106399A (ja) * | 1995-08-08 | 1997-04-22 | Matsushita Electric Ind Co Ltd | 機械翻訳装置及び機械翻訳方法 |
JPH10307823A (ja) * | 1997-05-09 | 1998-11-17 | Yuuna:Kk | 翻訳方法、翻訳装置及び翻訳プログラムを格納した 記録媒体 |
JP2001075957A (ja) * | 1999-08-24 | 2001-03-23 | Internatl Business Mach Corp <Ibm> | 自然言語構造の表示方法及び装置 |
JP2007018098A (ja) * | 2005-07-05 | 2007-01-25 | Advanced Telecommunication Research Institute International | テキスト分割処理装置及びコンピュータプログラム |
US20100128042A1 (en) * | 2008-07-10 | 2010-05-27 | Anthony Confrey | System and method for creating and displaying an animated flow of text and other media from an input of conventional text |
JP5621438B2 (ja) * | 2010-09-13 | 2014-11-12 | 株式会社リコー | 文書分割装置、文書処理システム、プログラム |
-
2019
- 2019-11-28 JP JP2019215343A patent/JP6926175B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020057401A (ja) | 2020-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pedersen | The FAR model: assessing quality in interlingual subtitling | |
KR101990023B1 (ko) | 외국어학습을 위한 청크단위 분리 규칙과 핵심어 자동 강세 표시 구현 방법 및 시스템 | |
US8214197B2 (en) | Apparatus, system, method, and computer program product for resolving ambiguities in translations | |
US8954333B2 (en) | Apparatus, method, and computer program product for processing input speech | |
WO2003065245A1 (fr) | Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur | |
JP2006277677A (ja) | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム | |
US9588967B2 (en) | Interpretation apparatus and method | |
JPWO2004081813A1 (ja) | 翻訳支援装置 | |
CN110740275A (zh) | 一种非线性编辑系统 | |
Álvarez et al. | Towards customized automatic segmentation of subtitles | |
JP6926175B2 (ja) | 表示支援装置、方法およびプログラム | |
JP2007018098A (ja) | テキスト分割処理装置及びコンピュータプログラム | |
US20230069113A1 (en) | Text Summarization Method and Text Summarization System | |
Pietikäinen | Analysing multilingual/lingua franca interactions using conversation analysis: Notes on transcription and representability 1 | |
JP2008009507A (ja) | 外国語の発音のカタカナ表記方法 | |
JP2017167805A (ja) | 表示支援装置、方法およびプログラム | |
Tardel et al. | Post-editing job profiles for subtitlers | |
KR20170050486A (ko) | 중국어 학습방법 및 그 기록매체 | |
JP4035111B2 (ja) | 対訳語抽出装置、及び対訳語抽出プログラム | |
WO2009144890A1 (ja) | 翻訳前換言規則生成システム | |
Nugroho et al. | Translation course 4.0 redefined: enhancing work efficiency and meaning accuracy using AEGISUB 3.2. 2 subtitling software | |
JP2002123281A (ja) | 音声合成装置 | |
JP2008269122A (ja) | 処理単位分割装置、処理単位分割方法、及びプログラム | |
WO2023047623A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
Novitasari et al. | Construction of English-French Multimodal Affective Conversational Corpus from TV Dramas |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210105 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210305 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210706 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210804 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6926175 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |