JP2017167805A - 表示支援装置、方法およびプログラム - Google Patents

表示支援装置、方法およびプログラム Download PDF

Info

Publication number
JP2017167805A
JP2017167805A JP2016052394A JP2016052394A JP2017167805A JP 2017167805 A JP2017167805 A JP 2017167805A JP 2016052394 A JP2016052394 A JP 2016052394A JP 2016052394 A JP2016052394 A JP 2016052394A JP 2017167805 A JP2017167805 A JP 2017167805A
Authority
JP
Japan
Prior art keywords
unit
character string
display control
divided character
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016052394A
Other languages
English (en)
Inventor
明子 坂本
Akiko Sakamoto
明子 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2016052394A priority Critical patent/JP2017167805A/ja
Priority to US15/433,720 priority patent/US10423700B2/en
Publication of JP2017167805A publication Critical patent/JP2017167805A/ja
Priority to JP2019215343A priority patent/JP6926175B2/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】内容の理解を支援することができる。【解決手段】本実施形態に係る表示支援装置は、取得部、第1処理部、第2処理部および表現制御部を含む。取得部は、文字列を取得する。第1処理部は、前記文字列を意味のまとまりを表す単位である第1単位で分割し、複数の分割文字列を生成する。第2処理部は、前記文字列について前記第1単位よりも大きい単位である第2単位を検出する。表示制御部は、前記複数の分割文字列を表示させる場合に前記第1単位および前記第2単位を区別する表示制御を行う。【選択図】図1

Description

本発明の実施形態は、表示支援装置、方法およびプログラムに関する。
音声認識結果を字幕表示する場面としては、例えば、会議において音声を聞き取ることができず内容の理解が難しい会議参加者に対し、情報保証を目的として音声認識結果を字幕表示する場面がある。また、翻訳結果を字幕表示する場面としては、異なる言語を母語とする参加者が集う会議で用いられる会議システムなどにおいて、異なる言語間での機械翻訳結果または人手による翻訳結果を字幕表示する場面がある。
上述のように字幕表示する際に、内容の進行とともに字幕が順次切り替わったり、既に表示されている古い字幕が新たに表示される字幕によって少しずつ画面外へ押し出されたりするような表示を行う場合、利用者が字幕を見ることができる時間は限られる。そのため、字幕の内容を明確にしたり翻訳の質を高めたりするために、字幕表示される音声認識結果または翻訳結果の文を分割する技術がある。
特開2007−18098号公報
しかし、実際の運用において、分割された音声認識結果または翻訳結果の文をそのまま表示しただけでは、字幕の構成要素間の区切りがわかりにくい。さらに、文構造を解析しきれないために、字幕の内容を参照するユーザの理解が追いつかず、情報伝達に支障が生じる場合がある。
本開示は、上述の課題を解決するためになされたものであり、内容の理解を支援することができる表示支援装置、方法およびプログラムを提供することを目的とする。
本実施形態に係る表示支援装置は、取得部、第1処理部、第2処理部および表現制御部を含む。取得部は、文字列を取得する。第1処理部は、前記文字列を意味のまとまりを表す単位である第1単位で分割し、複数の分割文字列を生成する。第2処理部は、前記文字列について前記第1単位よりも大きい単位である第2単位を検出する。表示制御部は、前記複数の分割文字列を表示させる場合に前記第1単位および前記第2単位を区別する表示制御を行う。
第1の実施形態に係る表示支援装置を示すブロック図。 第1処理部が参照するテーブルの一例を示す図。 第1処理部の処理結果の一例を示す図。 第2処理部が参照するテーブルの一例を示す図。 第2処理部の処理結果の一例を示す図。 第1の実施形態に係る表示制御部の動作を示すフローチャート。 第1の実施形態に係る表示制御部に係る表示制御の具体例を示す図。 表示制御部における表示制御の第1の別例を示す図。 表示制御部における表示制御の第2の別例を示す図。 第2の実施形態に係る表示支援装置を示すブロック図。 表現変換部で参照される変換パターンの一例を示す図。 表現変換部の処理結果の一例を示す図。 第2の実施形態に係る表示制御部による表示制御の具体例を示す図。 第3の実施形態に係る表示支援装置を示すブロック図。 翻訳部の処理結果の一例を示す図。 第3の実施形態に係る表示制御部による表示制御の具体例を示す図。 第1言語の分割文字列の区切り位置が変わる第1例に関する日英翻訳の場合の機械翻訳例を示す図。 第1言語の分割文字列の区切り位置が変わる第1例に関する日中翻訳の場合の機械翻訳例を示す図。 第1言語の分割文字列の区切り位置が変わる第2例に関する日中翻訳の場合の機械翻訳例を示す図。 第1言語の分割文字列の区切り位置が変わる第2例に関する日英翻訳の場合の機械翻訳例を示す図。 日英翻訳の場合における翻訳部の処理結果の別例を示す図。 日中翻訳の場合における翻訳部の処理結果の別例を示す図。 第4の実施形態に係る表示支援装置を示すブロック図。 語順決定部で参照する語順決定規則の第1例を示す図。 語順決定部の処理結果の一例を示す図。 第4の実施形態に係る表示制御部による表示制御の具体例を示す図。 第5の実施形態に係る第1処理部の処理結果の一例を示す図。 第5の実施形態に係る表示制御部の動作を示すフローチャート。 第5の実施形態に係る表示制御部による表示制御の具体例を示す図。 第5の実施形態の第1の変形例に係る表示制御部の動作を示すフローチャート。 第5の実施形態の第1の変形例に係る表示制御部による表示制御の具体例を示す図。 第5の実施形態の第2の変形例に係る表示制御部の動作を示すフローチャート。 第5の実施形態の第2の変形例に係る表示制御部による表示制御の具体例を示す図。 表現変換部により表現が変換された場合の処理の別例を示す図。 図30に示す処理についての表示制御の具体例を示す図。
以下、図面を参照しながら本実施形態に係る表示支援装置、方法およびプログラムについて詳細に説明する。なお、以下の実施形態では、同一の参照符号を付した部分は同様の動作を行うものとして、重複する説明を適宜省略する。
(第1の実施形態)
第1の実施形態に係る表示支援装置について図1のブロック図を参照して説明する。
第1の実施形態に係る表示支援装置100は、取得部101、第1処理部102、第2処理部103および表示制御部104を含む。
取得部101は、ユーザからの入力に基づいて入力文字列を取得する。ユーザからの入力としては、キーボード入力、手書き文字認識および音声を受け付けるマイク入力など、一般的に用いられる様々な方法が適用できる。
ユーザからの入力が音声による場合、取得部101は、音声の音声認識結果の文字列を入力文字列として取得し、さらにポーズ情報も併せて取得する。取得部101は、音声中の無音期間が一定時間以上続く状態をポーズ情報として取得すればよい。また、取得部101は、マイク入力の際にボタンを押下してから音声の入力を開始するような設定の場合、ボタンのオンオフなどを検出することによりポーズ情報を取得してもよい。
また、ユーザからの入力がキーボード入力や手書き文字認識処理などのテキスト入力による場合、取得部101は、確定情報を入力文字列と併せて取得する。取得部101は、エンターキーの押下、または、句点およびピリオドなどの入力を確定情報として取得すればよい。また、取得部101は、ユーザインタフェースに入力確定ボタンなど入力の確定を行う画面表示があれば、当該表示をタッチしたことまたはマウスなどでクリックしたことを確定情報として取得してもよい。
第1処理部102は、取得部101から入力文字列とポーズ情報または確定情報とを受け取る。第1処理部102は、入力文字列に対して形態素解析を行い、ポーズ情報または確定情報に基づいて、形態素解析した入力文字列を意味のまとまりを表す言語単位である第1言語単位(単に第1単位ともいう)で分割し、複数の分割文字列を生成する。
形態素解析には、CKY法や最長一致法といった一般的なあらゆる形態素解析の技術を用いることができる。なお、取得部101で取得した入力文字列に既に形態素解析結果に関する情報が付与されている場合には、第1処理部102は形態素解析を行わなくともよい。
第1処理部102は、それぞれの分割文字列に役割ラベルを付与する。役割ラベルには、例えば、格要素となる句を用いる場合の格の種別を示すラベル、単文であることを示すラベル、文末とされる時制のついた動詞句を用いる場合の文末に位置する句を示すラベル、文の構成や前後関係を示す接続詞、副詞またこれらに相当する表現を用いる場合の前後関係を示すラベル、並列の要素を用いる場合に並列の要素であることを示すラベル、ポーズを1つの第1言語単位として用いる場合のポーズを示すラベルが挙げられる。
第2処理部103は、第1処理部102から役割ラベルが付与された複数の分割文字列を受け取る。第2処理部103は、分割文字列から第1言語単位よりも大きい言語単位である第2言語単位(単に第2単位ともいう)を検出する。第2処理部103は、第2言語単位の末尾となる分割文字列に対し、末尾ラベルを付与する。末尾ラベルは、例えば、文節の末尾(節末ともいう)または文の末尾(文末ともいう)であることを示すラベル、重文であることを示すラベルが挙げられる。第2処理部103は、入力される分割文字列に付与された第1言語単位のラベルおよびポーズの並びを検出して、節末および文末などを判定し、該当する分割文字列に末尾ラベルを付与すればよい。
表示制御部104は、第2処理部103から役割ラベル(および末尾ラベル)が付与された複数の分割文字列を受け取る。表示制御部104は、役割ラベルおよび末尾ラベルに基づいて、複数の分割文字列を表示させる場合に、第1言語単位および第2言語単位を区別する表示制御を行う。表示制御は、複数の分割文字列間の関係が区別でき、ユーザにとってわかりやすくなるように表示させる制御であれば何でもよい。例えば、ディスプレイなどに複数の分割文字列を表示する際に、第1言語単位を区別するためにインデント(字下げ)表示したり、フォントの色を変更したり、下線を引くまたは斜体にするなどの装飾を施したり、第2言語単位の末尾となる分割文字列を表示した後に空行を入れたりまたは区切り線を引いたり、表示した第1言語単位を囲むようないわゆる吹き出しなどの図形を描画したりすることが挙げられる。表示制御の詳細については後述する。
次に、第1処理部102が参照するテーブルの一例について図2に示す。
図2に示すテーブル200には、第1言語単位検出パターン201と役割ラベル202とがそれぞれ対応付けられて格納される。
第1言語単位検出パターン201は、入力文字列を第1言語単位で分割するためのパターンであり、ここでは、入力文字列が句として区切られるときに文頭に出現する文字列のパターン、および、入力文字列が句として区切られるときに末尾に出現する文字列のパターンを示す。役割ラベル202は、第1言語単位検出パターン201の特徴を表すラベルを示し、ここでは格の種別を示すラベルである。第1処理部102は、入力文字列の形態素解析結果となる文字列である形態素列が、第1言語単位検出パターン201と一致するかどうかを判定する。形態素列が第1言語単位検出パターン201と一致すると判定される場合、第1処理部102は、形態素列の末尾を区切り位置とすることで分割文字列を生成し、一致した第1言語単位検出パターン201に対応する役割ラベル202を付与する。
具体的には、例えば、第1言語単位検出パターン201「文頭/最初/に」と役割ラベル202「[sentence adverb]」とが対応付けられる。なお、図2において、第1言語単位検出パターン201における「文頭」は、ポーズ情報または確定情報の直後を参照すればよく、「内容語」は、入力文字列に出現する文字列を示す。
なお、分割文字列の末尾に位置する形態素の直後にポーズ情報または確定情報がある場合、その情報を役割ラベルとして分割文字列に付与してもよい。
次に、第1処理部102の処理結果の一例について図3に示す。
第1処理部102により、図3に示すような分割文字列301から分割文字列310までと、それぞれに付与される役割ラベル202との処理結果を得ることができる。具体的には、分割文字列301「えー/まず/最初/に」は、テーブル200を参照することにより第1言語単位検出パターン201「文頭/最初/に」に一致しているので、分割文字列301には対応する役割ラベル202「[sentence adverb]」が付与される。
次に、第2処理部103が参照するテーブルの一例について図4に示す。
図4に示すテーブル400には、第2言語単位検出パターン401と末尾ラベル402とがそれぞれ対応付けられて格納される。
第2言語単位検出パターン401は、ここでは、文法上、句よりも大きい言語単位である節末および文末に出現する文字列のパターンを示す。末尾ラベル402は、節末または文末を示すラベルである。具体的には、第2言語単位検出パターン401「ます/けれど/も」と末尾ラベル402「<<節末>>」とが対応付けられる。
第2処理部103は、分割文字列が、第2言語単位検出パターン401と一致するかどうかを判定する。分割文字列が第2言語単位検出パターン401と一致すると判定される場合、第2処理部103は、分割文字列に対して、一致した第2言語単位検出パターンに対応する末尾ラベル402を付与する。
次に、第2処理部103の処理結果の一例について図5を参照して説明する。
第2処理部103により、図5に示すような分割文字列501から分割文字列510までと、それぞれに付与される役割ラベル202と、末尾ラベル402との処理結果を得ることができる。
具体的には、分割文字列503「・・・/ます/けれど/も」は、テーブル400を参照することにより第2言語単位検出パターン401「ます/けれど/も」に一致しているので、分割文字列503には対応する末尾ラベル402「<<節末>>」が付与される。同様に、分割文字列510「で/いる/訳/です」は、テーブル400を参照することにより第2言語単位検出パターン401「で/いる/訳/です」に一致しているので、分割文字列510には対応する末尾ラベル402「<<文末>>」が付与される。
次に、表示制御部104の動作について図6のフローチャートを参照して説明する。なお、図6の説明において「表示させる」とは、表示制御部104が、外部のディスプレイなどの表示装置(図示せず)に文字列や図形を表示させるように制御することをいい、例えば字幕やテロップとして表示させることをいう。また、表示制御部104は、分割文字列を表示する際のインデント数に関する変数を保持するとする。
ステップS601では、表示制御部104が、インデント数をゼロに設定する。
ステップS602では、表示制御部104が、表示における冒頭の区切り線を表示させる。
ステップS603は、表示制御部104が、設定されたインデントを行い、分割文字列を表示する。なお、初回の処理ではインデント数がゼロであるため、表示制御部104は分割文字列を行頭から表示させればよい。
ステップS604では、表示制御部104が、ステップS603で表示された分割文字列が文末であるかどうか、すなわち分割文字列に文末ラベルが付与されているかどうかを判定する。文末ラベルが付与されている場合、ステップS608に進み、文末ラベルが付与されていない場合、ステップS605に進む。
ステップS605では、表示制御部104が、ステップS603で表示された分割文字列が節末であるかどうか、すなわち節末ラベルが付与されているかどうかを判定する。節末ラベルが付与されている場合、ステップS609に進み、節末ラベルが付与されていない場合、ステップS606に進む。
ステップS606では、表示制御部104が、設定中のインデント数を1つインクリメントする。
ステップS607では、表示制御部104が、次の分割文字列があるかどうかを判定する。次の分割文字列がある場合は、ステップS603に戻り、同様の処理を繰り返す。次の分割文字列がない場合は、ステップS610に進む。
ステップS608では、文末ラベルにより文が終了したことが分かるので、表示制御部104が、区切り線を表示させ、インデント数をゼロに設定する。その後ステップS603に戻り、同様の処理を繰り返す。
ステップS609では、節末ラベルにより節が終了したことが分かるので、表示制御部104が、空行を表示させ、インデント数をゼロに設定する。その後ステップS603に戻り、同様の処理を繰り返す。
ステップS610では、表示制御部104が、区切り線を表示させる。以上で表示制御部104の動作を終了する。
第1の実施形態に係る表示制御部104に係る表示制御の具体例について図7を参照して説明する。
ここでは、図5に示す第2処理部103の処理結果について表示制御が行われ、ディスプレイやスクリーンに字幕として表示される例を示す。分割文字列501については、最初の分割文字列であり、インデント数がゼロであるので、冒頭の区切り線700が表示された後に、分割文字列501が表示される(表示701)。分割文字列501は文末ラベルでも節末ラベルでもないので、ステップS606においてインデント数が1つインクリメントされ、インデント数が1となる。
次の分割文字列502については、インデント数が1なので、分割文字列502の表示開始位置が、インデントとして規定される間隔の1つ分(インデント1つ分という)、右側に移動して表示される(表示702)。なお、図7の例は横書きの日本語なので、右側にインデントを行う表示であるが、縦書きの場合は下方向にインデントを行えばよく、アラビア語など右から左に記載する言語の場合は左側にインデントを行えばよい。
分割文字列501と同様に、分割文字列502は文末ラベルでも節末ラベルでもないので、インデント数が1つインクリメントされ、インデント数が2となる。
次の分割文字列503については、インデント数が2なので、分割文字列503は、インデント2つ分右側に移動した位置から表示される(表示703)。
ここで、分割文字列503は、節末ラベルが付与されているので、ステップS609における処理により、表示703の後に空行704が表示され、インデント数がゼロにリセットされる。
同様の処理を、分割文字列504から分割文字列509に対して行った場合、表示705から表示708、空行709および表示710から表示712が表示される。
なお、最後の分割文字列510について処理する場合、分割文字列510は文末ラベルが付与されているので、表示712が表示された後、ステップS610における処理により、末尾の区切り線713が表示される。
なお、節末ラベルが付与された分割文字列の表示後は、空行ではなく、冒頭および文末の区切り線と区別がつくような区切り線によって区切ってもよい。つまり、節末であるか文末であるかを区別できる表示形式であれば何でもよい。
次に、表示制御部104における表示制御の別例について図8Aおよび図8Bを参照して説明する。
ここでは、説明の便宜上、図5に示す分割文字列501から分割文字列510までが1つの文節を形成すると仮定する。
1つの節末に至るまでの文字列が長い場合、図7に示すフローチャートに従って処理した場合にはインデント数が多くなり、ディスプレイなどの表示面に収まらないような場合もあり得る。このような場合、例えば第1の別例として図8Aに示すように、インデント数が閾値に達したときにそれ以上インデント数を変更せずに表示してもよい。例えば、インデント数の閾値が5であれば、インデント数を6以上に増やさず、インデント数を5のまま後続の分割文字列を表示させればよい。また、同じインデント数で表示される分割文字列については、フォントサイズを小さくしたりフォントの色を変えたりするなどのユーザの視認性をさらに高める処理を行ってもよい。
第2の別例として、図8Bに示すように、インデント数が閾値に達したときにインデント数をゼロにリセットして、再度インデント数が閾値に達するまで表示を繰り返してもよい。
以上に示した第1の実施形態によれば、分割文字列を表示させる場合に、第1言語単位および第2言語単位を区別する表示制御を行うことで、例えば、句単位、節単位または文単位という異なる単位について違いが分かるように表示することができる。これによって、字幕やテロップとして表示される文字列の視認性を高めることができ、ユーザが内容を理解することを支援することができる。
(第2の実施形態)
第2の実施形態に係る表示支援装置について図9のブロック図を参照して説明する。
第2の実施形態に係る表示支援装置900は、取得部101、第1処理部102、第2処理部103、表示制御部104および表現変換部901を含む。
取得部101、第1処理部102および第2処理部103の動作は第1の実施形態と同様であるので、ここでの説明を省略する。
表現変換部901は、第2処理部103から役割ラベル(および末尾ラベル)が付与された分割文字列を受け取り、変換規則に基づいて、変換規則に該当する分割文字列の表現を別の表現に変換する。なお、表現変換部901は、第2処理部103で処理された分割文字列ではなく、第1処理部102から形態素解析された文字列を受け取り、変換規則に基づいて、形態素解析された入力文字列の表現を変換してもよい。このとき第1処理部102は、変換された入力文字列を第2処理部103に送ればよい。
表示制御部104は、変換された分割文字列について表示制御を行う。
次に、表現変換部901で参照される変換パターンの一例について図10を参照して説明する。
図10に示すテーブル1000には、変換対象パターン1001と変換パターン1002とが対応付けられて格納される。変換対象パターン1001は、変換対象となる文字列のパターンを示す。変換パターン1002は、変換対象パターン1001をどのように変換するかを示すパターンである。図10の例では、言い淀み、言い直し、言い誤り、およびフィラーなどを除去するためのパターンを変換パターン1002として用いる。
具体的には、変換対象パターン1001「えー」と変換パターン1002「(空白)」とが対応付けられる。つまり、「えー」というフィラーであれば「えー」を削除する。
なお、図10の例では、フィラーなどを除去する、いわゆる整文の処理を想定するが、これに限らず、話し言葉から書き言葉への変換またはこの逆の変換、方言から標準語への変換またはこの逆の変換、一地方の方言から別の地方の方言への変換、標準語からキャラクターが話すようないわゆるキャラ語への変換など、さまざまな表現の変換を行ってもよい。
次に、表現変換部901の処理結果の一例について図11に示す。
図11は、図5に示す第2処理部103の処理結果に対して、表現変換部901により分割文字列の表現が変換された例である。
例えば、分割文字列1101に関して、図5の例では、分割文字列501「えー/まず/最初/に」であったが、表現変換部901の処理により、フィラーが除去され「最初/に」に変換される。
また、分割文字列1107に関して、図5の例では、分割文字列507「まー/この/2/つ/の/方式/を/用い/て/おり/まし/て」であり、節末ラベルが付与されていたが、表現変換部901の処理により、「2/つ/の/方式/を/用い/て/い/ます」と変換され、節末ラベルから文末ラベルに変換される。
次に、第2の実施形態に係る表示制御部104による表示制御の具体例について図12に示す。図12に示すように、図7で表示されていたフィラーなどの冗長語が削除された表示が行われる。さらに、節末ラベルから文末ラベルに変換された分割文字列の表示1208の下の行には区切り線1209が表示される。これによって、ユーザにとってより字幕の内容を理解しやすい表示となる。
以上に示した第2の実施形態によれば、整文の処理を行うべく表現変換部が分割文字列の表現を変換することで、ユーザにとってより読みやすい字幕表示を行うことができ、ユーザが内容を理解することを支援できる。また、表現を方言などの別の表現に変換する場合には、字幕表示のバリエーションを広げることができる。
(第3の実施形態)
第3の実施形態に係る表示支援装置について図13のブロック図を参照して説明する。
第3の実施形態に係る表示支援装置1300は、取得部101、第1処理部102、第2処理部103、表示制御部104、表現変換部901および翻訳部1301を含む。
取得部101、第1処理部102、第2処理部103および表現変換部901の動作は第2の実施形態と同様であるので、ここでの説明を省略する。
翻訳部1301は、表現変換部901から必要に応じて変換された複数の分割文字列を受け取り、複数の分割文字列を第1言語から第2言語に機械翻訳する。機械翻訳の手法は、規則ベース機械翻訳エンジン、用例ベース機械翻訳エンジンまたは統計ベース機械翻訳エンジンなど、一般的に用いられているあらゆる翻訳エンジンを用いることができる。
表示制御部104は、機械翻訳された複数の分割文字列について表示制御を行う。
次に、翻訳部1301の処理結果の一例について図14を参照して説明する。
図14は、図11に示す表現変換部901により表現が変換された分割文字列1101から分割文字列1110までに対して、機械翻訳処理が行われた例であり、ここでは、第1言語の日本語から第2言語の英語に翻訳する場合(日英翻訳という)を示す。分割文字列1401から分割1410までに示すように、分割文字列ごとに翻訳が可能となる。なお、既に付与されているラベルは、そのまま保持される。
第3の実施形態に係る表示制御部104による表示制御の具体例について図15を参照して説明する。図15のように翻訳した内容が字幕表示されることで、第2言語を理解できるユーザにとっても内容を把握しやすくなる。
なお、第1言語から第2言語に翻訳する際に、第2言語の種類によっては翻訳単位となる分割文字列の長さを変更するほうが望ましい場合もある。例えば、日英翻訳と、日本語から中国語に翻訳する場合(日中翻訳という)とでは、翻訳単位をそれぞれの言語にあわせて設定するため、分割文字列として入力文字列を区切る位置(分割文字列の区切り位置)を変更するのが望ましい。
ここで、第2言語の種類に応じた文法の違いにより、第1言語の分割文字列の区切り位置が変わる第1例について図16Aおよび図16Bを参照して説明する。
図16Aは、日英翻訳の場合の機械翻訳例を示す。図16Bは、日中翻訳の場合の機械翻訳例を示す。
図16Aに示す日英翻訳の場合、日本語では、分割文字列1601「それから最後に」と分割文字列1602「会議音声の活用システムということで」とに分割されるが、図16Bに示す日中翻訳の場合、日本語では、分割文字列1603「それから最後に会議音声の活用システムということで」と1つにまとめられる。
反対に、図16Aの日英翻訳の場合、分割文字列1604「音声を文字に起こしたり、翻訳をするといったところを実は我々の中で使ってみましょうということでトライアルの開始をしようとしてまして」と1つの分割文字列が、図16Bの日中翻訳において分割文字列1605「音声を文字に起こしたり、翻訳をするといったところを」、分割文字列1606「実は我々の中で使ってみましょうということで」および分割文字列1607の一部「トライアルの開始をしようとしてまして・・・」と分割される。
上述のような翻訳単位の決定は、翻訳部1301が、第2言語の種類に関する情報(目的言語情報ともいう)を受け取り、予め設定される言語の翻訳単位規則に基づいて、第2言語単位内の分割文字列を結合または分割する。目的言語情報は、ユーザから指定により取得してもよい。また、予め第2言語が決定していれば、分割文字列が生成される段階で、第1処理部102が翻訳単位規則を参照して分割文字列を生成してもよい。
次に、第2言語の文法の違いにより、第1言語の分割文字列の区切り位置が変わる第2例について図17Aおよび図17Bを参照して説明する。
図17Aは、日中翻訳の場合の機械翻訳例を示す。図17Bは、日英翻訳の場合の機械翻訳例を示す。
一般的に日中翻訳の場合は、中国語は日本語よりも文字数が少なくなることが多いので、日本語の内容に対応する中国語は字幕表示できる。一方、日英翻訳の場合は、日本語よりも文字数が多くなることがある。よって、字幕の表示スペースから文字がはみ出さないように、必須ではない内容を翻訳しないようにしてもよい。
図17Aに示す日中翻訳では、分割文字列1701「宜しく願いします」に対応する
が翻訳されるが、図17Bに示す日英翻訳では、文字数を減らすべく、さらに対応する内容を表す翻訳も存在しないので、分割文字列1701「宜しく願いします」の翻訳が省略される。
翻訳部1301は、翻訳単位規則として翻訳文へ訳出しないキーワードを予め定めておき、図17Aおよび図17Bに示すような翻訳処理を行えばよい。
翻訳部1301の処理の別例について図18Aおよび図18Bを参照して説明する。
図18Aは、日英翻訳の場合の機械翻訳例を示す。図18Bは、日中翻訳の場合の機械翻訳例を示す。
第2言語の種類によっては、ある1つの分割文字列に対応する翻訳として、2つの分割文字列の翻訳文にわたって翻訳結果が反映したほうが自然な文となる場合がある。例えば、図18Aに示すように、翻訳部1301は、日本語の分割文字列1801「音声認識を我々はやってますので」を英語「as we are working on the speech recognition」に翻訳する。ここで、「ので」に対応する「as」は、対応する分割文字列の翻訳文として翻訳されればよい。
一方、図18Bに示すように、翻訳部1301は、日本語の分割文字列1801の「ので」を中国語に翻訳する場合は、
との2つの分割文字列の翻訳文に出現するように翻訳する。翻訳部1301は、翻訳単位規則として、2つの分割文字列の翻訳文に出現させるべきキーワードを予め定めておき、図18Aおよび図18Bに示すような翻訳処理を行えばよい。
以上に示した第3の実施形態によれば、第1言語から第2言語に翻訳した内容を表示させることで、第2言語を理解できるユーザにとっても内容を把握しやすくなり、ユーザが内容を理解することを支援することができる。
(第4の実施形態)
第4の実施形態に係る表示支援装置について図19のブロック図を参照して説明する。
第4の実施形態に係る表示支援装置1900は、取得部101、第1処理部102、第2処理部103、表示制御部104、表現変換部901、翻訳部1301および語順決定部1901を含む。
取得部101、第1処理部102、第2処理部103、表現変換部901および翻訳部1301の動作は第3の実施形態と同様であるので、ここでの説明を省略する。
語順決定部1901は、翻訳部1301から翻訳処理された分割文字列を受け取り、第2言語の語順決定規則に基づき、複数の分割文字列の表示順序を決定する。つまり、第2言語の文法順に沿って自然な順序となるように複数の分割文字列を並び替える。また、語順決定部1901は、必要に応じて末尾ラベルを付与し直す。なお、語順決定部1901は、第1言語の段階で倒置など順序が不自然な状態があれば、複数の分割文字列を並び替えてもよい。
表示制御部104は、並び替えられた分割文字列について表示制御を行う。
次に、語順決定部1901で参照する語順決定規則の第1例について図20を参照して説明する。
図20に示す語順決定規則のテーブル2000は、第1言語の語順パターン2001と第2言語の語順パターン2002とを対応付けて格納する。図20の例では、第1言語が日本語であり、第2言語が英語である例を示す。ここでは、分割文字列に付与される役割ラベルの順序が英語の語順として自然な順序となるような役割ラベルの順序で決定される。
具体的には、例えば、日本語の語順パターン2001が「[sentence adverb]→[object]→[predicate]」と、英語の語順パターン2002が「[sentence adverb]→[predicate]→[object]」とが対応付けられる。
次に、語順決定部1901の処理結果の一例について図21を参照して説明する。
語順を並び替える前の上述した図14の例では、第2言語単位中の分割文字列1401から分割文字列1403の順序が、「first[sentence adverb]」、「about machine translation [object]」、「we will introduce[predicate]<<節末>>」である。
語順決定部1901は、語順決定規則に基づき、[sentence adverb]→[predicate]→[object]の順に分割文字列1401から分割文字列1403を並び替える。さらに語順決定部1901は、第2言語単位の最後の分割文字列に末尾ラベルを付与し直す。結果として、分割文字列2101から分割文字列2103までが、「first[sentence adverb]」「we will introduce[predicate]」「about machine translation[object]<<節末>>」の並びとなる。なお、末尾ラベルの付与し直しは、第2処理部103が行ってもよい。
次に、第4の実施形態に係る表示制御部104による表示制御の具体例について図22を参照して説明する。
図22に示すように語順を変更した後は、翻訳文の表示順序が[first][we will introduce][about machine translation]の語順となるので、第2言語の文法として自然な順序で翻訳文が表示される。
以上に示した第4の実施形態によれば、語順決定部が第2言語の文法順に沿って自然な順序となるように複数の分割文字列を並び替えることで、第2言語を利用するユーザにより自然な字幕を表示させることができ、ユーザが内容を理解することを支援できる。
(第5の実施形態)
第5の実施形態では、第1言語の話者が複数である場合を想定する。
第5の実施形態に係る表示支援装置は、上述の実施形態のいずれか1つに示す表示支援装置を用いて実現される。
第5の実施形態に係る取得部101は、入力文字列に加えて、入力文字列を入力(発話)した話者を識別するための話者ごとに固有の話者情報を取得する。話者情報を取得する方法は、例えば、取得部101に接続されるマイクを話者ごとに用意することにより取得してもよいし、ビームフォーミングや音声特徴量を使った一般的な話者識別技術を用いて話者を識別し、話者情報を取得してもよい。
また、第1処理部102は、取得部101から入力文字列および話者情報を受け取り、上述の実施形態と同様にして得られた複数の分割文字列に対して、話者情報に基づいて話者ごとに分類するための話者ラベルを付与する。
表示制御部104は、第2処理部103から話者ラベルが付与された複数の分割文字列を受け取り、複数の分割文字列を表示させる場合に、話者ラベルに基づいて、話者ごとに区別しつつ、第1言語単位および第2言語単位を区別する表示制御を行う。
第5の実施形態に係る第1処理部102の処理結果の一例について図23に示す。
図23に示すように、役割ラベル202、末尾ラベル402に加えて、話者ラベル2300が付与される。
話者ラベルの決定方法は、例えば取得部101が取得した話者情報に基づいて、予めユーザの識別情報(IPアドレスや、ユーザIDが含まれるユーザの識別情報など)が得られる場合は、識別情報に従って識別してもよいし、話者A、話者Bなど、異なる話者情報であることが区別できるラベルを付与してもよい。
次に、第5の実施形態に係る表示制御部104の動作について図24のフローチャートを参照して説明する。
ステップS601、ステップS603からステップS607まで、およびステップS609の処理は、上述の実施形態と同様であるので、説明を省略する。
ステップS2401では、表示制御部104が、新しい吹き出しを用意する。
ステップS2402では、表示制御部104が、分割文字列に文末ラベルが付与されているので、現在の吹き出しを終了し、インデント数をゼロに設定する。また、ステップS2401に戻り、同様の処理を繰り返す。これにより、1つの文が、1つの吹き出しで表現されることになる。
ステップS2403では、全ての分割文字列について処理が終了したので、吹き出しを終了する。また、ステップS2401に戻り、同様の処理を繰り返す。
なお、話者ごとに吹き出しの枠線および枠線の色を変更するなど、話者の区別を明確にする処理を行ってもよい。また、第5の実施形態では、話者の区別に吹き出しを想定しているが、話者ごとに区別できればどのような表示でもよい。
次に、第5の実施形態に係る表示制御部104による表示制御の具体例について図25に示す。
図25は、図23に示す第2処理部103の処理結果に対して表示制御を行った例である。話者Aの発言については吹き出し2501、話者Bの発言については吹き出し2502、話者Cの発言については吹き出し2503といったように、話者ごと、さらに文ごとに吹き出しが表示されることとなり、字幕の視認性を向上させることができる。
(第5の実施形態の第1の変形例)
第5の実施形態の第1の変形例に係る表示制御部104の動作について図26のフローチャートを参照して説明する。
ステップS604、ステップS605、ステップS607、ステップS2401およびステップS2403の処理は、上述の実施形態と同様であるので説明を省略する。
ステップS2601では、表示制御部104が、分割文字列の内容を、吹き出しより小さい囲みで、吹き出しに収まるサイズの囲み内に表示する。
ステップS2602では、表示制御部104が、現在の吹き出しを終了し、ステップS2401に戻り同様の処理を繰り返す。
ステップS2603では、表示制御部104が、空行を表示し、ステップS2601に戻り同様の処理を繰り返す。
次に、第5の実施形態の第1の変形例に係る表示制御部104による表示制御の具体例について図27に示す。
図27に示すように、吹き出し内において分割文字列が囲み2701で表示されるので、字幕の視認性を向上させることができる。
(第5の実施形態の第2の変形例)
第5の実施形態の第2の変形例について図28のフローチャートを参照して説明する。
ステップS603からステップS605まで、ステップS607、ステップS2401、ステップS2403およびステップS2603の処理は、上述の実施形態と同様であるので説明を省略する。
ステップS2801では、表示制御部104が、節末ラベルまたは文末ラベルが付与されていない場合、分割文字列の末尾に句点を表示する。
ステップS2802では、表示制御部104が、分割文字列の末尾に読点を表示し、現在の吹き出しを終了したのち、ステップS2401に戻り同様の処理を繰り返す。
次に、第5の実施形態の第2の変形例に係る表示例について図29に示す。
図29においても、図27と同様に、吹き出し内において分割文字列が句読点で表示されるので、字幕の視認性を向上させることができる。
次に、表現変換部901により表現が変換された場合の表示制御の別例について図30に示す。
図30は、図23の分割文字列2309が、表現変換部901により変換され、併せて付与されていたラベルが節末ラベルから文末ラベルに付け替えられた場合である。表示制御部104は、分割文字列3001の文字列の色を変更する。
次に、表現変換部901により表現が変換された場合の表示の別例について図31に示す。このように、変換された箇所の色を変更することで、ユーザは変更があった箇所を容易に把握することができる。なお、色を変更することに限らず、下線を引いたり、斜体にしたりしてもよい。
以上に示した第5の実施形態によれば、複数のユーザからの入力に対して、吹き出しを用いて話者ごとに発言を分離し、さらに吹き出し内において分割文字列について上述の実施形態のような表示制御を行うことで、話者ごとの区別が容易となり、ユーザが内容を理解することを支援できる。
上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した表示支援装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RW、Blu−ray(登録商標)Discなど)、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の表示支援装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行なうことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
100,900,1300,1900・・・表示支援装置、101・・・取得部、102・・・第1処理部、103・・・第2処理部、104・・・表示制御部、200,400,1000,2000・・・テーブル、201・・・第1言語単位検出パターン、202・・・役割ラベル、301〜310,501〜510,1101〜1110,1401〜1410,1601〜1607,1701,1801,2101〜2110,2301〜2312,3001・・・分割文字列、401・・・第2言語単位検出パターン、402・・・末尾ラベル、701〜703,705〜708,710〜712,1201〜1203,1205〜1208,1210〜1212,1501〜1503,1505〜1508,1510〜1512,2201〜2203,2205〜2208,2210〜2212・・・表示、704,709,1204,1504,2204・・・空行、700,713,1200,1209,1213,1500,1509,1513,2200,2209,2213・・・区切り線、901・・・表現変換部、1001・・・変換対象パターン、1002・・・変換パターン、1301・・・翻訳部、1802,1803・・・翻訳文、1901・・・語順決定部、2001・・・第1言語の語順パターン、2002・・・第2言語の語順パターン、2300・・・話者ラベル、2501,2502,2503・・・吹き出し、2701・・・囲み。

Claims (11)

  1. 文字列を取得する取得部と、
    前記文字列を意味のまとまりを表す単位である第1単位で分割し、複数の分割文字列を生成する第1処理部と、
    前記文字列について前記第1単位よりも大きい単位である第2単位を検出する第2処理部と、
    前記複数の分割文字列を表示させる場合に前記第1単位および前記第2単位を区別する表示制御を行う表示制御部と、を具備する表示支援装置。
  2. 変換規則に基づいて、前記分割文字列の表現を別の表現に変換する変換部をさらに具備し、
    前記表示制御部は、変換された前記分割文字列について表示制御を行う請求項1に記載の表示支援装置。
  3. 前記表示制御部は、前記複数の分割文字列を表示させる場合に、第1分割文字列に続く第2分割文字列をインデントして表示させる処理を行い、該第2分割文字列が前記第2単位の末尾に位置する場合、該第2分割文字列を表示させた後に空行を表示させる処理を行う請求項1または請求項2に記載の表示支援装置。
  4. 前記複数の分割文字列を第1言語から第2言語に機械翻訳する翻訳部をさらに具備し、
    前記表示制御部は、機械翻訳された分割文字列について表示制御を行う請求項1から請求項3のいずれか1項に記載の表示支援装置。
  5. 前記第2言語の語順決定規則に基づいて、前記複数の分割文字列の表示順序を決定する決定部をさらに具備し、
    前記表示制御部は、前記表示順序が決定された分割文字列について表示制御を行う請求項4に記載の表示支援装置。
  6. 前記文字列は、音声認識結果の文字列である請求項1から請求項5のいずれか1項に記載の表示支援装置。
  7. 前記第1単位は句であり、前記第2単位は節または文である請求項1から請求項6のいずれか1項に記載の表示支援装置。
  8. 前記第1単位は単文であり、前記第2単位は重文である請求項1から請求項6のいずれか1項に記載の表示支援装置。
  9. 前記取得部は、話者ごとの話者情報をさらに取得し、
    前記表示制御部は、前記話者ごとに区別して表示制御を行う請求項1から請求項8のいずれか1項に記載の表示支援装置。
  10. 文字列を取得し、
    前記文字列を意味のまとまりを表す単位である第1単位で分割し、複数の分割文字列を生成し、
    前記文字列について前記第1単位よりも大きい単位である第2単位を検出し、
    前記複数の分割文字列を表示させる場合に前記第1単位および前記第2単位を区別する表示制御を行う表示支援方法。
  11. コンピュータを、
    文字列を取得する取得手段と、
    前記文字列を意味のまとまりを表す単位である第1単位で分割し、複数の分割文字列を生成する第1処理手段と、
    前記文字列について前記第1単位よりも大きい単位である第2単位を検出する第2処理手段と、
    前記複数の分割文字列を表示させる場合に前記第1単位および前記第2単位を区別する表示制御を行う表示制御手段として機能させるための表示支援プログラム。
JP2016052394A 2016-03-16 2016-03-16 表示支援装置、方法およびプログラム Pending JP2017167805A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2016052394A JP2017167805A (ja) 2016-03-16 2016-03-16 表示支援装置、方法およびプログラム
US15/433,720 US10423700B2 (en) 2016-03-16 2017-02-15 Display assist apparatus, method, and program
JP2019215343A JP6926175B2 (ja) 2016-03-16 2019-11-28 表示支援装置、方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016052394A JP2017167805A (ja) 2016-03-16 2016-03-16 表示支援装置、方法およびプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019215343A Division JP6926175B2 (ja) 2016-03-16 2019-11-28 表示支援装置、方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2017167805A true JP2017167805A (ja) 2017-09-21

Family

ID=59855650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016052394A Pending JP2017167805A (ja) 2016-03-16 2016-03-16 表示支援装置、方法およびプログラム

Country Status (2)

Country Link
US (1) US10423700B2 (ja)
JP (1) JP2017167805A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022030754A (ja) 2020-08-07 2022-02-18 株式会社東芝 入力支援システム、入力支援方法およびプログラム
JP2023067353A (ja) * 2021-11-01 2023-05-16 株式会社東芝 字幕生成装置、方法及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05151256A (ja) * 1991-11-29 1993-06-18 Hitachi Ltd 機械翻訳方法および機械翻訳装置
JPH05189480A (ja) * 1992-01-14 1993-07-30 Nec Corp 発話データ処理装置
JPH09106399A (ja) * 1995-08-08 1997-04-22 Matsushita Electric Ind Co Ltd 機械翻訳装置及び機械翻訳方法
JPH10307823A (ja) * 1997-05-09 1998-11-17 Yuuna:Kk 翻訳方法、翻訳装置及び翻訳プログラムを格納した 記録媒体
JP2001075957A (ja) * 1999-08-24 2001-03-23 Internatl Business Mach Corp <Ibm> 自然言語構造の表示方法及び装置
JP2007018098A (ja) * 2005-07-05 2007-01-25 Advanced Telecommunication Research Institute International テキスト分割処理装置及びコンピュータプログラム
US20100128042A1 (en) * 2008-07-10 2010-05-27 Anthony Confrey System and method for creating and displaying an animated flow of text and other media from an input of conventional text

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05176232A (ja) 1991-12-19 1993-07-13 Fujitsu General Ltd 字幕重畳装置
JP3162832B2 (ja) 1992-10-28 2001-05-08 日本放送協会 字幕スーパー画面作成装置
JPH08212228A (ja) 1995-02-02 1996-08-20 Sanyo Electric Co Ltd 要約文作成装置および要約音声作成装置
JP2758851B2 (ja) 1995-03-28 1998-05-28 株式会社エイ・ティ・アール音声翻訳通信研究所 自動翻訳装置及び自動通訳装置
JPH10234016A (ja) 1997-02-21 1998-09-02 Hitachi Ltd 映像信号処理装置及びそれを備えた映像表示装置及び記録再生装置
JP3059398B2 (ja) 1997-03-04 2000-07-04 株式会社エイ・ティ・アール音声翻訳通信研究所 自動通訳装置
JP3009642B2 (ja) 1997-10-22 2000-02-14 株式会社エイ・ティ・アール音声翻訳通信研究所 音声言語処理単位変換装置
US6279018B1 (en) 1998-12-21 2001-08-21 Kudrollis Software Inventions Pvt. Ltd. Abbreviating and compacting text to cope with display space constraint in computer software
US7006967B1 (en) 1999-02-05 2006-02-28 Custom Speech Usa, Inc. System and method for automating transcription services
US6272461B1 (en) 1999-03-22 2001-08-07 Siemens Information And Communication Networks, Inc. Method and apparatus for an enhanced presentation aid
JP2001027995A (ja) 1999-07-13 2001-01-30 Sony Corp 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体
US6625508B1 (en) 1999-08-10 2003-09-23 Xerox Corporation Dynamically varying policy driven print engine
JP2001175280A (ja) 1999-12-17 2001-06-29 Nippon Hoso Kyokai <Nhk> 字幕表示装置および字幕制御用記憶媒体
JP2001224002A (ja) 2000-02-08 2001-08-17 Atr Interpreting Telecommunications Res Lab 音声・映像同期方法および音声・映像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002010222A (ja) 2000-06-27 2002-01-11 Toshiba Corp 文字多重放送受信装置
US6968506B2 (en) 2001-01-16 2005-11-22 Brainshark, Inc. Method of and system for composing, delivering, viewing and managing audio-visual presentations over a communications network
US8874431B2 (en) * 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US7035804B2 (en) 2001-04-26 2006-04-25 Stenograph, L.L.C. Systems and methods for automated audio transcription, translation, and transfer
JP4538618B2 (ja) 2001-05-17 2010-09-08 独立行政法人情報通信研究機構 字幕番組制作システムにおける表示単位字幕文の自動生成方法
WO2003063067A1 (en) * 2002-01-24 2003-07-31 Chatterbox Systems, Inc. Method and system for locating positions in printed texts and delivering multimedia information
JP4127668B2 (ja) 2003-08-15 2008-07-30 株式会社東芝 情報処理装置、情報処理方法、およびプログラム
JP4839838B2 (ja) 2003-12-12 2011-12-21 日本電気株式会社 情報処理システム、情報処理方法および情報処理用プログラム
JP4218758B2 (ja) 2004-12-21 2009-02-04 インターナショナル・ビジネス・マシーンズ・コーポレーション 字幕生成装置、字幕生成方法、及びプログラム
JP4852918B2 (ja) 2005-07-22 2012-01-11 富士ゼロックス株式会社 翻訳装置、翻訳方法およびプログラム
US9116989B1 (en) 2005-08-19 2015-08-25 At&T Intellectual Property Ii, L.P. System and method for using speech for data searching during presentations
JP2007213176A (ja) 2006-02-08 2007-08-23 Sony Corp 情報処理装置および方法、並びにプログラム
US7860719B2 (en) 2006-08-19 2010-12-28 International Business Machines Corporation Disfluency detection for a speech-to-speech translation system using phrase-level machine translation with weighted finite state transducers
JP4271224B2 (ja) 2006-09-27 2009-06-03 株式会社東芝 音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよびシステム
JP4481972B2 (ja) 2006-09-28 2010-06-16 株式会社東芝 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム
US8090570B2 (en) 2006-10-26 2012-01-03 Mobile Technologies, Llc Simultaneous translation of open domain lectures and speeches
US9128926B2 (en) 2006-10-26 2015-09-08 Facebook, Inc. Simultaneous translation of open domain lectures and speeches
US20080300852A1 (en) 2007-05-30 2008-12-04 David Johnson Multi-Lingual Conference Call
US20080300872A1 (en) 2007-05-31 2008-12-04 Microsoft Corporation Scalable summaries of audio or visual content
US8290779B2 (en) 2007-09-18 2012-10-16 Verizon Patent And Licensing Inc. System and method for providing a managed language translation service
JP5243886B2 (ja) 2008-08-11 2013-07-24 旭化成株式会社 字幕出力装置、字幕出力方法及びプログラム
US9547642B2 (en) 2009-06-17 2017-01-17 Empire Technology Development Llc Voice to text to voice processing
JP5014449B2 (ja) 2010-02-26 2012-08-29 シャープ株式会社 会議システム、情報処理装置、会議支援方法、情報処理方法、及びコンピュータプログラム
US9323756B2 (en) 2010-03-22 2016-04-26 Lenovo (Singapore) Pte. Ltd. Audio book and e-book synchronization
JP2012181358A (ja) 2011-03-01 2012-09-20 Nec Corp テキスト表示時間決定装置、テキスト表示システム、方法およびプログラム
JP5776252B2 (ja) 2011-03-25 2015-09-09 カシオ計算機株式会社 生徒端末及びプログラム
US9110891B2 (en) 2011-12-12 2015-08-18 Google Inc. Auto-translation for multi user audio and video
JP5750380B2 (ja) 2012-02-10 2015-07-22 株式会社東芝 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
US8918311B1 (en) 2012-03-21 2014-12-23 3Play Media, Inc. Intelligent caption systems and methods
JP2013206253A (ja) 2012-03-29 2013-10-07 Toshiba Corp 機械翻訳装置、方法、およびプログラム
JP5727980B2 (ja) 2012-09-28 2015-06-03 株式会社東芝 表現変換装置、方法およびプログラム
KR102196671B1 (ko) 2013-01-11 2020-12-30 엘지전자 주식회사 전자 기기 및 전자 기기의 제어 방법
CN103106195B (zh) * 2013-01-21 2018-12-11 刘树根 表意构件识别提取和基于表意构件的机译人校互动翻译方法
US9798722B2 (en) 2013-02-27 2017-10-24 Avaya Inc. System and method for transmitting multiple text streams of a communication in different languages
JP2014202832A (ja) * 2013-04-02 2014-10-27 株式会社東芝 編集装置、方法、及びプログラム
JP2015060332A (ja) 2013-09-18 2015-03-30 株式会社東芝 音声翻訳装置、音声翻訳方法およびプログラム
JP6235280B2 (ja) 2013-09-19 2017-11-22 株式会社東芝 音声同時処理装置、方法およびプログラム
US9699404B2 (en) 2014-03-19 2017-07-04 Microsoft Technology Licensing, Llc Closed caption alignment
JP2016057986A (ja) 2014-09-11 2016-04-21 株式会社東芝 音声翻訳装置、方法およびプログラム
JP2016062357A (ja) 2014-09-18 2016-04-25 株式会社東芝 音声翻訳装置、方法およびプログラム
JP6334354B2 (ja) 2014-09-30 2018-05-30 株式会社東芝 機械翻訳装置、方法およびプログラム
JP2015072701A (ja) 2014-11-18 2015-04-16 株式会社東芝 翻訳装置、方法およびプログラム
US20160170970A1 (en) 2014-12-12 2016-06-16 Microsoft Technology Licensing, Llc Translation Control
US20170053541A1 (en) 2015-01-02 2017-02-23 Iryna Tsyrina Interactive educational system and method
JP6392150B2 (ja) 2015-03-18 2018-09-19 株式会社東芝 講演支援装置、方法およびプログラム
US9460713B1 (en) 2015-03-30 2016-10-04 Google Inc. Language model biasing modulation
JP6470097B2 (ja) 2015-04-22 2019-02-13 株式会社東芝 通訳装置、方法およびプログラム
JP2015187738A (ja) 2015-05-15 2015-10-29 株式会社東芝 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
JP2015201215A (ja) 2015-05-25 2015-11-12 株式会社東芝 機械翻訳装置、方法、およびプログラム
JP2016186646A (ja) 2016-06-07 2016-10-27 株式会社東芝 音声翻訳装置、音声翻訳方法および音声翻訳プログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05151256A (ja) * 1991-11-29 1993-06-18 Hitachi Ltd 機械翻訳方法および機械翻訳装置
JPH05189480A (ja) * 1992-01-14 1993-07-30 Nec Corp 発話データ処理装置
JPH09106399A (ja) * 1995-08-08 1997-04-22 Matsushita Electric Ind Co Ltd 機械翻訳装置及び機械翻訳方法
JPH10307823A (ja) * 1997-05-09 1998-11-17 Yuuna:Kk 翻訳方法、翻訳装置及び翻訳プログラムを格納した 記録媒体
JP2001075957A (ja) * 1999-08-24 2001-03-23 Internatl Business Mach Corp <Ibm> 自然言語構造の表示方法及び装置
JP2007018098A (ja) * 2005-07-05 2007-01-25 Advanced Telecommunication Research Institute International テキスト分割処理装置及びコンピュータプログラム
US20100128042A1 (en) * 2008-07-10 2010-05-27 Anthony Confrey System and method for creating and displaying an animated flow of text and other media from an input of conventional text

Also Published As

Publication number Publication date
US20170270080A1 (en) 2017-09-21
US10423700B2 (en) 2019-09-24

Similar Documents

Publication Publication Date Title
KR101990023B1 (ko) 외국어학습을 위한 청크단위 분리 규칙과 핵심어 자동 강세 표시 구현 방법 및 시스템
US8954333B2 (en) Apparatus, method, and computer program product for processing input speech
US9588967B2 (en) Interpretation apparatus and method
CN110740275B (zh) 一种非线性编辑系统
JP2008077601A (ja) 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
CN112270917B (zh) 一种语音合成方法、装置、电子设备及可读存储介质
CN110781649A (zh) 一种字幕编辑方法、装置及计算机存储介质、电子设备
EP4322029A1 (en) Method and apparatus for generating video corpus, and related device
JP6926175B2 (ja) 表示支援装置、方法およびプログラム
JP2007018098A (ja) テキスト分割処理装置及びコンピュータプログラム
JP2017167805A (ja) 表示支援装置、方法およびプログラム
WO2018198807A1 (ja) 翻訳装置
JP2020060642A (ja) 音声合成システム、及び音声合成装置
KR101990019B1 (ko) 하이브리드 자막 효과 구현 단말 및 방법
KR20160002081A (ko) 음성 인식을 활용한 수화 번역 장치 및 그 방법
JP2010169973A (ja) 外国語学習支援システム、及びプログラム
US20230069113A1 (en) Text Summarization Method and Text Summarization System
JP5722375B2 (ja) 文末表現変換装置、方法、及びプログラム
JP2006236037A (ja) 音声対話コンテンツ作成方法、装置、プログラム、記録媒体
Varga Online Automatic Subtitling Platforms and Machine Translation
CN110310620B (zh) 基于原生发音强化学习的语音融合方法
KR102107447B1 (ko) 선택적 음성 모델의 적용에 기초한 번역 기능을 제공하는 텍스트 음성 변환 장치 및 그 동작 방법
US20130080144A1 (en) Machine translation apparatus, a method and a non-transitory computer readable medium thereof
JP4035111B2 (ja) 対訳語抽出装置、及び対訳語抽出プログラム
WO2009144890A1 (ja) 翻訳前換言規則生成システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191008

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200331