JP2020057401A - Display support device, method and program - Google Patents

Display support device, method and program Download PDF

Info

Publication number
JP2020057401A
JP2020057401A JP2019215343A JP2019215343A JP2020057401A JP 2020057401 A JP2020057401 A JP 2020057401A JP 2019215343 A JP2019215343 A JP 2019215343A JP 2019215343 A JP2019215343 A JP 2019215343A JP 2020057401 A JP2020057401 A JP 2020057401A
Authority
JP
Japan
Prior art keywords
unit
character string
divided character
display control
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019215343A
Other languages
Japanese (ja)
Other versions
JP6926175B2 (en
Inventor
明子 坂本
Akiko Sakamoto
明子 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2016052394A external-priority patent/JP2017167805A/en
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2019215343A priority Critical patent/JP6926175B2/en
Publication of JP2020057401A publication Critical patent/JP2020057401A/en
Application granted granted Critical
Publication of JP6926175B2 publication Critical patent/JP6926175B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

To provide a display support device capable of supporting comprehension of contents.SOLUTION: A display support device in an embodiment includes an acquisition part, a first processing part, a second processing part and a display control unit. The acquisition part acquires a character string. The first processing part segments the character string using a first unit which is a unit representing a meaningful unit and generates a plurality of segmented character strings. The second processing part detects a second unit which is a unit larger than the first unit with respect to the character string. The display control unit controls the display of the plurality of segmented character strings while differentiating the first unit and the second unit from each other.SELECTED DRAWING: Figure 1

Description

本発明の実施形態は、表示支援装置、方法およびプログラムに関する。   Embodiments of the present invention relate to a display support device, a method, and a program.

音声認識結果を字幕表示する場面としては、例えば、会議において音声を聞き取ることができず内容の理解が難しい会議参加者に対し、情報保証を目的として音声認識結果を字幕表示する場面がある。また、翻訳結果を字幕表示する場面としては、異なる言語を母語とする参加者が集う会議で用いられる会議システムなどにおいて、異なる言語間での機械翻訳結果または人手による翻訳結果を字幕表示する場面がある。
上述のように字幕表示する際に、内容の進行とともに字幕が順次切り替わったり、既に表示されている古い字幕が新たに表示される字幕によって少しずつ画面外へ押し出されたりするような表示を行う場合、利用者が字幕を見ることができる時間は限られる。そのため、字幕の内容を明確にしたり翻訳の質を高めたりするために、字幕表示される音声認識結果または翻訳結果の文を分割する技術がある。
As a scene in which the speech recognition result is displayed as a caption, for example, there is a scene in which a speech recognition result is displayed as a caption for a conference participant who cannot hear the speech in the conference and has difficulty understanding the content for the purpose of guaranteeing information. In addition, as a scene in which a translation result is displayed in a caption, in a conference system used in a conference in which participants in different languages are native speakers, a scene in which a machine translation result in different languages or a translation result by hand is displayed in a caption is displayed. is there.
When displaying subtitles as described above, when the subtitles are switched sequentially as the content progresses, or when the old subtitles that are already displayed are pushed out of the screen little by little by the newly displayed subtitles In addition, the time when the user can see the subtitles is limited. Therefore, in order to clarify the contents of subtitles and to improve the quality of translation, there is a technique for dividing a sentence of a speech recognition result or a translation result displayed as subtitles.

特開2007−18098号公報JP 2007-18098 A

しかし、実際の運用において、分割された音声認識結果または翻訳結果の文をそのまま表示しただけでは、字幕の構成要素間の区切りがわかりにくい。さらに、文構造を解析しきれないために、字幕の内容を参照するユーザの理解が追いつかず、情報伝達に支障が生じる場合がある。   However, in an actual operation, it is difficult to distinguish the subtitle components by simply displaying the sentence of the divided speech recognition result or translation result as it is. Furthermore, since the sentence structure cannot be completely analyzed, the user who refers to the contents of the subtitles cannot catch up with the understanding, which may hinder information transmission.

本開示は、上述の課題を解決するためになされたものであり、内容の理解を支援することができる表示支援装置、方法およびプログラムを提供することを目的とする。   The present disclosure has been made to solve the above-described problem, and has as its object to provide a display support device, a method, and a program that can support understanding of contents.

本実施形態に係る表示支援装置は、取得部、第1処理部、第2処理部および表現制御部を含む。取得部は、文字列を取得する。第1処理部は、前記文字列を意味のまとまりを表す単位である第1単位で分割し、複数の分割文字列を生成する。第2処理部は、前記文字列について前記第1単位よりも大きい単位である第2単位を検出する。表示制御部は、前記複数の分割文字列を表示させる場合に前記第1単位および前記第2単位を区別する表示制御を行う。   The display support device according to the present embodiment includes an acquisition unit, a first processing unit, a second processing unit, and an expression control unit. The obtaining unit obtains a character string. The first processing unit divides the character string into first units, which are units representing meanings, to generate a plurality of divided character strings. The second processing unit detects a second unit of the character string that is a unit larger than the first unit. The display control unit performs display control for distinguishing the first unit and the second unit when displaying the plurality of divided character strings.

第1の実施形態に係る表示支援装置を示すブロック図。FIG. 1 is a block diagram illustrating a display support device according to a first embodiment. 第1処理部が参照するテーブルの一例を示す図。The figure which shows an example of the table which a 1st process part refers. 第1処理部の処理結果の一例を示す図。FIG. 7 is a diagram illustrating an example of a processing result of a first processing unit. 第2処理部が参照するテーブルの一例を示す図。The figure which shows an example of the table which a 2nd process part refers. 第2処理部の処理結果の一例を示す図。FIG. 9 is a diagram illustrating an example of a processing result of a second processing unit. 第1の実施形態に係る表示制御部の動作を示すフローチャート。5 is a flowchart illustrating the operation of the display control unit according to the first embodiment. 第1の実施形態に係る表示制御部に係る表示制御の具体例を示す図。FIG. 4 is a diagram illustrating a specific example of display control according to the display control unit according to the first embodiment. 表示制御部における表示制御の第1の別例を示す図。The figure which shows the 1st another example of the display control in a display control part. 表示制御部における表示制御の第2の別例を示す図。The figure which shows the 2nd another example of the display control in a display control part. 第2の実施形態に係る表示支援装置を示すブロック図。FIG. 9 is a block diagram showing a display support device according to a second embodiment. 表現変換部で参照される変換パターンの一例を示す図。The figure which shows an example of the conversion pattern referred by the expression conversion part. 表現変換部の処理結果の一例を示す図。The figure which shows an example of the processing result of the expression conversion part. 第2の実施形態に係る表示制御部による表示制御の具体例を示す図。FIG. 9 is a diagram illustrating a specific example of display control by a display control unit according to the second embodiment. 第3の実施形態に係る表示支援装置を示すブロック図。FIG. 10 is a block diagram showing a display support device according to a third embodiment. 翻訳部の処理結果の一例を示す図。FIG. 7 is a diagram illustrating an example of a processing result of a translation unit. 第3の実施形態に係る表示制御部による表示制御の具体例を示す図。FIG. 14 is a diagram showing a specific example of display control by a display control unit according to the third embodiment. 第1言語の分割文字列の区切り位置が変わる第1例に関する日英翻訳の場合の機械翻訳例を示す図。The figure which shows the example of the machine translation in the case of the Japanese-English translation regarding the 1st example in which the division | segmentation position of the division | segmentation character string of a 1st language changes. 第1言語の分割文字列の区切り位置が変わる第1例に関する日中翻訳の場合の機械翻訳例を示す図。The figure which shows the example of the machine translation in the case of the Japanese-Chinese translation regarding the 1st example in which the division | segmentation position of the division | segmentation character string of a 1st language changes. 第1言語の分割文字列の区切り位置が変わる第2例に関する日中翻訳の場合の機械翻訳例を示す図。The figure which shows the example of the machine translation in the case of the Japanese-Chinese translation regarding the 2nd example in which the division | segmentation position of the division | segmentation character string of a 1st language changes. 第1言語の分割文字列の区切り位置が変わる第2例に関する日英翻訳の場合の機械翻訳例を示す図。The figure which shows the example of the machine translation in the case of the Japanese-English translation about the 2nd example in which the division | segmentation position of the division | segmentation character string of a 1st language changes. 日英翻訳の場合における翻訳部の処理結果の別例を示す図。The figure which shows the example of another of the processing result of the translation part in the case of Japanese-English translation. 日中翻訳の場合における翻訳部の処理結果の別例を示す図。The figure which shows another example of the processing result of the translation part in the case of Japanese-Chinese translation. 第4の実施形態に係る表示支援装置を示すブロック図。FIG. 14 is a block diagram showing a display support device according to a fourth embodiment. 語順決定部で参照する語順決定規則の第1例を示す図。The figure which shows the 1st example of the word order determination rule referred by a word order determination part. 語順決定部の処理結果の一例を示す図。The figure which shows an example of the processing result of a word order determination part. 第4の実施形態に係る表示制御部による表示制御の具体例を示す図。FIG. 14 is a diagram showing a specific example of display control by a display control unit according to a fourth embodiment. 第5の実施形態に係る第1処理部の処理結果の一例を示す図。FIG. 18 is a diagram illustrating an example of a processing result of a first processing unit according to the fifth embodiment. 第5の実施形態に係る表示制御部の動作を示すフローチャート。15 is a flowchart illustrating the operation of the display control unit according to the fifth embodiment. 第5の実施形態に係る表示制御部による表示制御の具体例を示す図。FIG. 18 is a diagram showing a specific example of display control by a display control unit according to a fifth embodiment. 第5の実施形態の第1の変形例に係る表示制御部の動作を示すフローチャート。21 is a flowchart showing the operation of the display control unit according to a first modification of the fifth embodiment. 第5の実施形態の第1の変形例に係る表示制御部による表示制御の具体例を示す図。FIG. 19 is a diagram showing a specific example of display control by a display control unit according to a first modification of the fifth embodiment. 第5の実施形態の第2の変形例に係る表示制御部の動作を示すフローチャート。20 is a flowchart showing the operation of the display control unit according to a second modification of the fifth embodiment. 第5の実施形態の第2の変形例に係る表示制御部による表示制御の具体例を示す図。FIG. 19 is a diagram showing a specific example of display control by a display control unit according to a second modification of the fifth embodiment. 表現変換部により表現が変換された場合の処理の別例を示す図。The figure which shows another example of the process when the expression was converted by the expression conversion part. 図30に示す処理についての表示制御の具体例を示す図。FIG. 31 is a diagram showing a specific example of display control for the process shown in FIG. 30.

以下、図面を参照しながら本実施形態に係る表示支援装置、方法およびプログラムについて詳細に説明する。なお、以下の実施形態では、同一の参照符号を付した部分は同様の動作を行うものとして、重複する説明を適宜省略する。   Hereinafter, a display support device, a method, and a program according to the present embodiment will be described in detail with reference to the drawings. In the following embodiments, portions denoted by the same reference numerals perform the same operation, and duplicate description will be omitted as appropriate.

(第1の実施形態)
第1の実施形態に係る表示支援装置について図1のブロック図を参照して説明する。 第1の実施形態に係る表示支援装置100は、取得部101、第1処理部102、第2処理部103および表示制御部104を含む。
(First embodiment)
The display support device according to the first embodiment will be described with reference to the block diagram of FIG. The display support device 100 according to the first embodiment includes an acquisition unit 101, a first processing unit 102, a second processing unit 103, and a display control unit 104.

取得部101は、ユーザからの入力に基づいて入力文字列を取得する。ユーザからの入力としては、キーボード入力、手書き文字認識および音声を受け付けるマイク入力など、一般的に用いられる様々な方法が適用できる。   The obtaining unit 101 obtains an input character string based on an input from a user. Various commonly used methods such as keyboard input, handwritten character recognition, and microphone input for receiving voice can be applied as input from the user.

ユーザからの入力が音声による場合、取得部101は、音声の音声認識結果の文字列を入力文字列として取得し、さらにポーズ情報も併せて取得する。取得部101は、音声中の無音期間が一定時間以上続く状態をポーズ情報として取得すればよい。また、取得部101は、マイク入力の際にボタンを押下してから音声の入力を開始するような設定の場合、ボタンのオンオフなどを検出することによりポーズ情報を取得してもよい。   When the input from the user is by voice, the obtaining unit 101 obtains a character string of a voice recognition result of the voice as an input character string, and further obtains pause information. The acquisition unit 101 may acquire, as pause information, a state in which a silent period in a voice continues for a predetermined time or more. In addition, if the setting is such that the input of voice is started after the button is pressed at the time of microphone input, the obtaining unit 101 may obtain the pause information by detecting the on / off of the button.

また、ユーザからの入力がキーボード入力や手書き文字認識処理などのテキスト入力による場合、取得部101は、確定情報を入力文字列と併せて取得する。取得部101は、エンターキーの押下、または、句点およびピリオドなどの入力を確定情報として取得すればよい。また、取得部101は、ユーザインタフェースに入力確定ボタンなど入力の確定を行う画面表示があれば、当該表示をタッチしたことまたはマウスなどでクリックしたことを確定情報として取得してもよい。   When the input from the user is a text input such as a keyboard input or a handwritten character recognition process, the acquiring unit 101 acquires the determined information together with the input character string. The acquisition unit 101 may acquire depression of an enter key or input of a period, a period, and the like as final information. Further, if the user interface has a screen display for confirming an input such as an input confirmation button on the user interface, the acquisition unit 101 may acquire, as confirmation information, that the display is touched or clicked with a mouse or the like.

第1処理部102は、取得部101から入力文字列とポーズ情報または確定情報とを受け取る。第1処理部102は、入力文字列に対して形態素解析を行い、ポーズ情報または確定情報に基づいて、形態素解析した入力文字列を意味のまとまりを表す言語単位である第1言語単位(単に第1単位ともいう)で分割し、複数の分割文字列を生成する。
形態素解析には、CKY法や最長一致法といった一般的なあらゆる形態素解析の技術を用いることができる。なお、取得部101で取得した入力文字列に既に形態素解析結果に関する情報が付与されている場合には、第1処理部102は形態素解析を行わなくともよい。
The first processing unit 102 receives an input character string and pose information or confirmation information from the acquisition unit 101. The first processing unit 102 performs a morphological analysis on the input character string, and converts the input character string subjected to the morphological analysis into a first language unit (simply (Also referred to as one unit) to generate a plurality of divided character strings.
For the morphological analysis, any general morphological analysis technique such as the CKY method or the longest match method can be used. If the input character string acquired by the acquisition unit 101 has already been given information on the result of the morphological analysis, the first processing unit 102 does not need to perform the morphological analysis.

第1処理部102は、それぞれの分割文字列に役割ラベルを付与する。役割ラベルには、例えば、格要素となる句を用いる場合の格の種別を示すラベル、単文であることを示すラベル、文末とされる時制のついた動詞句を用いる場合の文末に位置する句を示すラベル、文の構成や前後関係を示す接続詞、副詞またこれらに相当する表現を用いる場合の前後関係を示すラベル、並列の要素を用いる場合に並列の要素であることを示すラベル、ポーズを1つの第1言語単位として用いる場合のポーズを示すラベルが挙げられる。   The first processing unit 102 assigns a role label to each divided character string. Role labels include, for example, a label indicating the type of case when using a phrase that is a case element, a label indicating that it is a simple sentence, and a phrase located at the end of a sentence when using a tense verb phrase that is the end of a sentence Label, a conjunction indicating the composition or context of the sentence, an adverb or a label indicating the context when using an equivalent expression, a label indicating that the element is a parallel element when using a parallel element, and a pause. There is a label indicating a pose when used as one first language unit.

第2処理部103は、第1処理部102から役割ラベルが付与された複数の分割文字列を受け取る。第2処理部103は、分割文字列から第1言語単位よりも大きい言語単位である第2言語単位(単に第2単位ともいう)を検出する。第2処理部103は、第2言語単位の末尾となる分割文字列に対し、末尾ラベルを付与する。末尾ラベルは、例えば、文節の末尾(節末ともいう)または文の末尾(文末ともいう)であることを示すラベル、重文であることを示すラベルが挙げられる。第2処理部103は、入力される分割文字列に付与された第1言語単位のラベルおよびポーズの並びを検出して、節末および文末などを判定し、該当する分割文字列に末尾ラベルを付与すればよい。   The second processing unit 103 receives from the first processing unit 102 a plurality of divided character strings to which role labels have been assigned. The second processing unit 103 detects a second language unit (also simply referred to as a second unit), which is a language unit larger than the first language unit, from the divided character string. The second processing unit 103 assigns an end label to the divided character string at the end of the second language unit. The end label includes, for example, a label indicating the end of a clause (also referred to as the end of a clause), the end of a sentence (also referred to as the end of a sentence), and a label indicating that the sentence is a multiple sentence. The second processing unit 103 detects the arrangement of labels and poses in the first language unit assigned to the input divided character string, determines the end of a clause, the end of a sentence, and the like, and assigns the end label to the corresponding divided character string. What is necessary is just to give.

表示制御部104は、第2処理部103から役割ラベル(および末尾ラベル)が付与された複数の分割文字列を受け取る。表示制御部104は、役割ラベルおよび末尾ラベルに基づいて、複数の分割文字列を表示させる場合に、第1言語単位および第2言語単位を区別する表示制御を行う。表示制御は、複数の分割文字列間の関係が区別でき、ユーザにとってわかりやすくなるように表示させる制御であれば何でもよい。例えば、ディスプレイなどに複数の分割文字列を表示する際に、第1言語単位を区別するためにインデント(字下げ)表示したり、フォントの色を変更したり、下線を引くまたは斜体にするなどの装飾を施したり、第2言語単位の末尾となる分割文字列を表示した後に空行を入れたりまたは区切り線を引いたり、表示した第1言語単位を囲むようないわゆる吹き出しなどの図形を描画したりすることが挙げられる。表示制御の詳細については後述する。   The display control unit 104 receives from the second processing unit 103 a plurality of divided character strings to which role labels (and end labels) are added. The display control unit 104 performs display control for distinguishing the first language unit and the second language unit when displaying a plurality of divided character strings based on the role label and the end label. The display control may be any control as long as the relationship between a plurality of divided character strings can be distinguished and displayed so that the user can easily understand the relationship. For example, when displaying a plurality of divided character strings on a display or the like, an indent (indentation) is displayed to distinguish the first language unit, a font color is changed, or an underline is drawn or italicized. Or display a divided character string at the end of the second language unit, insert blank lines or draw a separator line, or draw a figure such as a so-called speech bubble that surrounds the displayed first language unit. Or to do so. Details of the display control will be described later.

次に、第1処理部102が参照するテーブルの一例について図2に示す。
図2に示すテーブル200には、第1言語単位検出パターン201と役割ラベル202とがそれぞれ対応付けられて格納される。
Next, an example of a table referred to by the first processing unit 102 is shown in FIG.
In the table 200 shown in FIG. 2, the first language unit detection pattern 201 and the role label 202 are stored in association with each other.

第1言語単位検出パターン201は、入力文字列を第1言語単位で分割するためのパターンであり、ここでは、入力文字列が句として区切られるときに文頭に出現する文字列のパターン、および、入力文字列が句として区切られるときに末尾に出現する文字列のパターンを示す。役割ラベル202は、第1言語単位検出パターン201の特徴を表すラベルを示し、ここでは格の種別を示すラベルである。第1処理部102は、入力文字列の形態素解析結果となる文字列である形態素列が、第1言語単位検出パターン201と一致するかどうかを判定する。形態素列が第1言語単位検出パターン201と一致すると判定される場合、第1処理部102は、形態素列の末尾を区切り位置とすることで分割文字列を生成し、一致した第1言語単位検出パターン201に対応する役割ラベル202を付与する。   The first language unit detection pattern 201 is a pattern for dividing an input character string into first language units. Here, a pattern of a character string that appears at the beginning of a sentence when the input character string is divided as a phrase, and Indicates the pattern of the character string that appears at the end when the input character string is separated as a phrase. The role label 202 indicates a label indicating the feature of the first language unit detection pattern 201, and here is a label indicating a type of case. The first processing unit 102 determines whether a morpheme string that is a character string that is a result of the morphological analysis of the input character string matches the first language unit detection pattern 201. If it is determined that the morpheme string matches the first language unit detection pattern 201, the first processing unit 102 generates a divided character string by using the end of the morpheme string as a delimiter position, and detects the matched first language unit detection. A role label 202 corresponding to the pattern 201 is given.

具体的には、例えば、第1言語単位検出パターン201「文頭/最初/に」と役割ラベル202「[sentence adverb]」とが対応付けられる。なお、図2において、第1言語単位検出パターン201における「文頭」は、ポーズ情報または確定情報の直後を参照すればよく、「内容語」は、入力文字列に出現する文字列を示す。   Specifically, for example, the first language unit detection pattern 201 “sentence / first / ni” is associated with the role label 202 “[sentence adverb]”. In FIG. 2, the “head of sentence” in the first language unit detection pattern 201 may refer to the position immediately after the pause information or the confirmation information, and the “content word” indicates a character string that appears in the input character string.

なお、分割文字列の末尾に位置する形態素の直後にポーズ情報または確定情報がある場合、その情報を役割ラベルとして分割文字列に付与してもよい。   If there is pause information or confirmation information immediately after the morpheme located at the end of the divided character string, that information may be added to the divided character string as a role label.

次に、第1処理部102の処理結果の一例について図3に示す。
第1処理部102により、図3に示すような分割文字列301から分割文字列310までと、それぞれに付与される役割ラベル202との処理結果を得ることができる。具体的には、分割文字列301「えー/まず/最初/に」は、テーブル200を参照することにより第1言語単位検出パターン201「文頭/最初/に」に一致しているので、分割文字列301には対応する役割ラベル202「[sentence adverb]」が付与される。
Next, an example of a processing result of the first processing unit 102 is shown in FIG.
The first processing unit 102 can obtain the processing results of the divided character strings 301 to 310 as shown in FIG. 3 and the role labels 202 assigned to the respective character strings. More specifically, since the divided character string 301 “E / First / First / Ni” matches the first language unit detection pattern 201 “Sentence / First / Ni” by referring to the table 200, the divided character string 301 A corresponding role label 202 “[sentence adverb]” is assigned to the column 301.

次に、第2処理部103が参照するテーブルの一例について図4に示す。
図4に示すテーブル400には、第2言語単位検出パターン401と末尾ラベル402とがそれぞれ対応付けられて格納される。
Next, an example of a table referred to by the second processing unit 103 is shown in FIG.
In the table 400 shown in FIG. 4, the second language unit detection pattern 401 and the end label 402 are stored in association with each other.

第2言語単位検出パターン401は、ここでは、文法上、句よりも大きい言語単位である節末および文末に出現する文字列のパターンを示す。末尾ラベル402は、節末または文末を示すラベルである。具体的には、第2言語単位検出パターン401「ます/けれど/も」と末尾ラベル402「<<節末>>」とが対応付けられる。   Here, the second language unit detection pattern 401 indicates a pattern of a character string appearing at the end of a clause and at the end of a sentence, which is a language unit larger than a phrase in terms of grammar. The end label 402 is a label indicating the end of a section or the end of a sentence. Specifically, the second language unit detection pattern 401 “mas / de / mo” is associated with the end label 402 “<< section end >>”.

第2処理部103は、分割文字列が、第2言語単位検出パターン401と一致するかどうかを判定する。分割文字列が第2言語単位検出パターン401と一致すると判定される場合、第2処理部103は、分割文字列に対して、一致した第2言語単位検出パターンに対応する末尾ラベル402を付与する。   The second processing unit 103 determines whether the divided character string matches the second language unit detection pattern 401. If it is determined that the divided character string matches the second language unit detection pattern 401, the second processing unit 103 assigns the tail label 402 corresponding to the matched second language unit detection pattern to the divided character string. .

次に、第2処理部103の処理結果の一例について図5を参照して説明する。
第2処理部103により、図5に示すような分割文字列501から分割文字列510までと、それぞれに付与される役割ラベル202と、末尾ラベル402との処理結果を得ることができる。
Next, an example of a processing result of the second processing unit 103 will be described with reference to FIG.
The second processing unit 103 can obtain the processing results of the divided character strings 501 to 510, the role label 202 assigned to each character string, and the end label 402 as shown in FIG.

具体的には、分割文字列503「・・・/ます/けれど/も」は、テーブル400を参照することにより第2言語単位検出パターン401「ます/けれど/も」に一致しているので、分割文字列503には対応する末尾ラベル402「<<節末>>」が付与される。同様に、分割文字列510「で/いる/訳/です」は、テーブル400を参照することにより第2言語単位検出パターン401「で/いる/訳/です」に一致しているので、分割文字列510には対応する末尾ラベル402「<<文末>>」が付与される。   More specifically, since the divided character string 503 “... / mas / de / mo” matches the second language unit detection pattern 401 “mas / de / mo” by referring to the table 400, The corresponding end label 402 “<< section end >>” is assigned to the divided character string 503. Similarly, since the divided character string 510 “de / I / translation / is” matches the second language unit detection pattern 401 “de / i / translation / is” by referring to the table 400, the divided character string 510 The column 510 is provided with a corresponding end label 402 “<< sentence end >>”.

次に、表示制御部104の動作について図6のフローチャートを参照して説明する。なお、図6の説明において「表示させる」とは、表示制御部104が、外部のディスプレイなどの表示装置(図示せず)に文字列や図形を表示させるように制御することをいい、例えば字幕やテロップとして表示させることをいう。また、表示制御部104は、分割文字列を表示する際のインデント数に関する変数を保持するとする。   Next, the operation of the display control unit 104 will be described with reference to the flowchart in FIG. Note that “display” in the description of FIG. 6 means that the display control unit 104 controls the display device (not shown) such as an external display to display a character string or a graphic. Or display as a telop. It is also assumed that the display control unit 104 holds a variable related to the number of indents when displaying a divided character string.

ステップS601では、表示制御部104が、インデント数をゼロに設定する。
ステップS602では、表示制御部104が、表示における冒頭の区切り線を表示させる。
ステップS603は、表示制御部104が、設定されたインデントを行い、分割文字列を表示する。なお、初回の処理ではインデント数がゼロであるため、表示制御部104は分割文字列を行頭から表示させればよい。
In step S601, the display control unit 104 sets the number of indents to zero.
In step S602, the display control unit 104 displays the first dividing line in the display.
In step S603, the display control unit 104 performs the set indentation and displays the divided character string. Since the number of indents is zero in the first processing, the display control unit 104 may display the divided character string from the beginning of the line.

ステップS604では、表示制御部104が、ステップS603で表示された分割文字列が文末であるかどうか、すなわち分割文字列に文末ラベルが付与されているかどうかを判定する。文末ラベルが付与されている場合、ステップS608に進み、文末ラベルが付与されていない場合、ステップS605に進む。
ステップS605では、表示制御部104が、ステップS603で表示された分割文字列が節末であるかどうか、すなわち節末ラベルが付与されているかどうかを判定する。節末ラベルが付与されている場合、ステップS609に進み、節末ラベルが付与されていない場合、ステップS606に進む。
In step S604, the display control unit 104 determines whether or not the divided character string displayed in step S603 is the end of a sentence, that is, whether or not an end-of-sentence label is given to the divided character string. If the end-of-sentence label has been assigned, the process proceeds to step S608. If the end-of-sentence label has not been assigned, the process proceeds to step S605.
In step S605, the display control unit 104 determines whether the divided character string displayed in step S603 is the end of a section, that is, whether or not a section end label is added. If the end-of-section label has been assigned, the process proceeds to step S609. If the end-of-section label has not been assigned, the process proceeds to step S606.

ステップS606では、表示制御部104が、設定中のインデント数を1つインクリメントする。
ステップS607では、表示制御部104が、次の分割文字列があるかどうかを判定する。次の分割文字列がある場合は、ステップS603に戻り、同様の処理を繰り返す。次の分割文字列がない場合は、ステップS610に進む。
ステップS608では、文末ラベルにより文が終了したことが分かるので、表示制御部104が、区切り線を表示させ、インデント数をゼロに設定する。その後ステップS603に戻り、同様の処理を繰り返す。
In step S606, the display control unit 104 increments the number of indents being set by one.
In step S607, the display control unit 104 determines whether there is a next divided character string. If there is a next divided character string, the process returns to step S603, and the same processing is repeated. If there is no next divided character string, the process proceeds to step S610.
In step S608, since the end of the sentence can be known from the sentence end label, the display control unit 104 displays a dividing line and sets the number of indents to zero. Thereafter, the flow returns to step S603, and the same processing is repeated.

ステップS609では、節末ラベルにより節が終了したことが分かるので、表示制御部104が、空行を表示させ、インデント数をゼロに設定する。その後ステップS603に戻り、同様の処理を繰り返す。
ステップS610では、表示制御部104が、区切り線を表示させる。以上で表示制御部104の動作を終了する。
In step S609, since the end of the section is known from the section end label, the display control unit 104 displays a blank line and sets the number of indents to zero. Thereafter, the flow returns to step S603, and the same processing is repeated.
In step S610, the display control unit 104 displays a dividing line. Thus, the operation of the display control unit 104 ends.

第1の実施形態に係る表示制御部104に係る表示制御の具体例について図7を参照して説明する。
ここでは、図5に示す第2処理部103の処理結果について表示制御が行われ、ディスプレイやスクリーンに字幕として表示される例を示す。分割文字列501については、最初の分割文字列であり、インデント数がゼロであるので、冒頭の区切り線700が表示された後に、分割文字列501が表示される(表示701)。分割文字列501は文末ラベルでも節末ラベルでもないので、ステップS606においてインデント数が1つインクリメントされ、インデント数が1となる。
A specific example of display control performed by the display control unit 104 according to the first embodiment will be described with reference to FIG.
Here, an example is shown in which display control is performed on the processing result of the second processing unit 103 shown in FIG. 5 and displayed as subtitles on a display or a screen. Since the divided character string 501 is the first divided character string and the number of indents is zero, the divided character string 501 is displayed after the initial delimiter line 700 is displayed (display 701). Since the divided character string 501 is neither a sentence end label nor a section end label, the number of indents is incremented by one in step S606, and the number of indents becomes one.

次の分割文字列502については、インデント数が1なので、分割文字列502の表示開始位置が、インデントとして規定される間隔の1つ分(インデント1つ分という)、右側に移動して表示される(表示702)。なお、図7の例は横書きの日本語なので、右側にインデントを行う表示であるが、縦書きの場合は下方向にインデントを行えばよく、アラビア語など右から左に記載する言語の場合は左側にインデントを行えばよい。   As for the next divided character string 502, the number of indents is 1, so the display start position of the divided character string 502 is moved to the right by one interval (referred to as one indent) defined as the indent and displayed. (Display 702). Note that the example of FIG. 7 is horizontally written Japanese, so indentation is performed on the right side. However, in the case of vertical writing, indentation may be performed in the downward direction. In the case of a language written from right to left such as Arabic, Just indent to the left.

分割文字列501と同様に、分割文字列502は文末ラベルでも節末ラベルでもないので、インデント数が1つインクリメントされ、インデント数が2となる。   Similarly to the divided character string 501, the divided character string 502 is neither a sentence end label nor a section end label, so the number of indents is incremented by one, and the number of indents becomes two.

次の分割文字列503については、インデント数が2なので、分割文字列503は、インデント2つ分右側に移動した位置から表示される(表示703)。
ここで、分割文字列503は、節末ラベルが付与されているので、ステップS609における処理により、表示703の後に空行704が表示され、インデント数がゼロにリセットされる。
Since the number of indents for the next divided character string 503 is 2, the divided character string 503 is displayed from the position moved to the right by two indents (display 703).
Here, since the end-of-section label is assigned to the divided character string 503, a blank line 704 is displayed after the display 703 by the processing in step S609, and the number of indents is reset to zero.

同様の処理を、分割文字列504から分割文字列509に対して行った場合、表示705から表示708、空行709および表示710から表示712が表示される。   When the same processing is performed on the divided character strings 504 to 509, a display 705 to a display 708, a blank line 709, and a display 710 to a display 712 are displayed.

なお、最後の分割文字列510について処理する場合、分割文字列510は文末ラベルが付与されているので、表示712が表示された後、ステップS610における処理により、末尾の区切り線713が表示される。   When processing is performed on the last divided character string 510, since the divided character string 510 is provided with the end-of-sentence label, the display 712 is displayed, and then the end separator line 713 is displayed by the processing in step S610. .

なお、節末ラベルが付与された分割文字列の表示後は、空行ではなく、冒頭および文末の区切り線と区別がつくような区切り線によって区切ってもよい。つまり、節末であるか文末であるかを区別できる表示形式であれば何でもよい。   After displaying the divided character string to which the end-of-section label is added, the character string may be separated not by a blank line but by a dividing line that can be distinguished from the dividing line at the beginning and at the end of the sentence. In other words, any display format can be used to distinguish between the end of a section and the end of a sentence.

次に、表示制御部104における表示制御の別例について図8Aおよび図8Bを参照して説明する。
ここでは、説明の便宜上、図5に示す分割文字列501から分割文字列510までが1つの文節を形成すると仮定する。
Next, another example of display control in the display control unit 104 will be described with reference to FIGS. 8A and 8B.
Here, for convenience of explanation, it is assumed that the divided character strings 501 to 510 shown in FIG. 5 form one phrase.

1つの節末に至るまでの文字列が長い場合、図7に示すフローチャートに従って処理した場合にはインデント数が多くなり、ディスプレイなどの表示面に収まらないような場合もあり得る。このような場合、例えば第1の別例として図8Aに示すように、インデント数が閾値に達したときにそれ以上インデント数を変更せずに表示してもよい。例えば、インデント数の閾値が5であれば、インデント数を6以上に増やさず、インデント数を5のまま後続の分割文字列を表示させればよい。また、同じインデント数で表示される分割文字列については、フォントサイズを小さくしたりフォントの色を変えたりするなどのユーザの視認性をさらに高める処理を行ってもよい。   If the character string up to the end of one section is long, the number of indents may increase when the processing is performed according to the flowchart shown in FIG. 7 and may not fit on a display surface such as a display. In such a case, for example, as shown in FIG. 8A as a first alternative, when the number of indents reaches a threshold, the indentation may be displayed without changing the number of indents. For example, if the threshold value of the number of indents is 5, the subsequent divided character string may be displayed without increasing the number of indents to 6 or more and keeping the number of indents at 5. Further, for the divided character strings displayed with the same number of indents, a process of further increasing the visibility of the user, such as reducing the font size or changing the font color, may be performed.

第2の別例として、図8Bに示すように、インデント数が閾値に達したときにインデント数をゼロにリセットして、再度インデント数が閾値に達するまで表示を繰り返してもよい。   As a second alternative, as shown in FIG. 8B, when the number of indents reaches the threshold, the number of indents may be reset to zero, and the display may be repeated until the number of indents reaches the threshold again.

以上に示した第1の実施形態によれば、分割文字列を表示させる場合に、第1言語単位および第2言語単位を区別する表示制御を行うことで、例えば、句単位、節単位または文単位という異なる単位について違いが分かるように表示することができる。これによって、字幕やテロップとして表示される文字列の視認性を高めることができ、ユーザが内容を理解することを支援することができる。   According to the first embodiment described above, when a divided character string is displayed, display control for distinguishing the first language unit and the second language unit is performed, for example, a phrase unit, a clause unit, or a sentence unit. Different units can be displayed so that the difference can be understood. Thereby, the visibility of a character string displayed as a caption or a telop can be improved, and it is possible to assist the user in understanding the content.

(第2の実施形態)
第2の実施形態に係る表示支援装置について図9のブロック図を参照して説明する。 第2の実施形態に係る表示支援装置900は、取得部101、第1処理部102、第2処理部103、表示制御部104および表現変換部901を含む。
取得部101、第1処理部102および第2処理部103の動作は第1の実施形態と同様であるので、ここでの説明を省略する。
(Second embodiment)
A display support device according to the second embodiment will be described with reference to the block diagram of FIG. The display support device 900 according to the second embodiment includes an acquisition unit 101, a first processing unit 102, a second processing unit 103, a display control unit 104, and an expression conversion unit 901.
The operations of the acquisition unit 101, the first processing unit 102, and the second processing unit 103 are the same as those in the first embodiment, and a description thereof will not be repeated.

表現変換部901は、第2処理部103から役割ラベル(および末尾ラベル)が付与された分割文字列を受け取り、変換規則に基づいて、変換規則に該当する分割文字列の表現を別の表現に変換する。なお、表現変換部901は、第2処理部103で処理された分割文字列ではなく、第1処理部102から形態素解析された文字列を受け取り、変換規則に基づいて、形態素解析された入力文字列の表現を変換してもよい。このとき第1処理部102は、変換された入力文字列を第2処理部103に送ればよい。
表示制御部104は、変換された分割文字列について表示制御を行う。
The expression conversion unit 901 receives the divided character string to which the role label (and the tail label) is added from the second processing unit 103, and converts the expression of the divided character string corresponding to the conversion rule into another expression based on the conversion rule. Convert. Note that the expression conversion unit 901 receives not the divided character string processed by the second processing unit 103 but the character string subjected to morphological analysis from the first processing unit 102, and performs input morphological analysis based on the conversion rule. The column representation may be converted. At this time, the first processing unit 102 may send the converted input character string to the second processing unit 103.
The display control unit 104 performs display control on the converted divided character string.

次に、表現変換部901で参照される変換パターンの一例について図10を参照して説明する。
図10に示すテーブル1000には、変換対象パターン1001と変換パターン1002とが対応付けられて格納される。変換対象パターン1001は、変換対象となる文字列のパターンを示す。変換パターン1002は、変換対象パターン1001をどのように変換するかを示すパターンである。図10の例では、言い淀み、言い直し、言い誤り、およびフィラーなどを除去するためのパターンを変換パターン1002として用いる。
Next, an example of a conversion pattern referred to by the expression conversion unit 901 will be described with reference to FIG.
In a table 1000 shown in FIG. 10, a conversion target pattern 1001 and a conversion pattern 1002 are stored in association with each other. The conversion target pattern 1001 indicates a character string pattern to be converted. The conversion pattern 1002 is a pattern indicating how to convert the conversion target pattern 1001. In the example of FIG. 10, a pattern for removing stagnation, rephrasing, typo, filler, and the like is used as the conversion pattern 1002.

具体的には、変換対象パターン1001「えー」と変換パターン1002「(空白)」とが対応付けられる。つまり、「えー」というフィラーであれば「えー」を削除する。   Specifically, the conversion target pattern 1001 “er” and the conversion pattern 1002 “(blank)” are associated with each other. That is, if the filler is “er”, “er” is deleted.

なお、図10の例では、フィラーなどを除去する、いわゆる整文の処理を想定するが、これに限らず、話し言葉から書き言葉への変換またはこの逆の変換、方言から標準語への変換またはこの逆の変換、一地方の方言から別の地方の方言への変換、標準語からキャラクターが話すようないわゆるキャラ語への変換など、さまざまな表現の変換を行ってもよい。   In the example of FIG. 10, it is assumed that a process of so-called sentence removing fillers and the like is performed. However, the present invention is not limited to this, and conversion from spoken language to written language or vice versa, conversion from dialect to standard language, or Various expressions may be converted, such as a reverse conversion, a conversion from one local dialect to another local dialect, and a conversion from a standard language to a so-called character language spoken by a character.

次に、表現変換部901の処理結果の一例について図11に示す。
図11は、図5に示す第2処理部103の処理結果に対して、表現変換部901により分割文字列の表現が変換された例である。
Next, an example of the processing result of the expression conversion unit 901 is shown in FIG.
FIG. 11 is an example in which the expression of the divided character string is converted by the expression conversion unit 901 with respect to the processing result of the second processing unit 103 shown in FIG.

例えば、分割文字列1101に関して、図5の例では、分割文字列501「えー/まず/最初/に」であったが、表現変換部901の処理により、フィラーが除去され「最初/に」に変換される。
また、分割文字列1107に関して、図5の例では、分割文字列507「まー/この/2/つ/の/方式/を/用い/て/おり/まし/て」であり、節末ラベルが付与されていたが、表現変換部901の処理により、「2/つ/の/方式/を/用い/て/い/ます」と変換され、節末ラベルから文末ラベルに変換される。
For example, regarding the divided character string 1101, in the example of FIG. 5, the divided character string 501 is “E / First / First / First”, but the filler is removed by the processing of the expression conversion unit 901 to be “First / First”. Is converted.
Also, regarding the divided character string 1107, in the example of FIG. 5, the divided character string 507 is "ma / this / 2 / one / no / method / use / use / use / mao / mashi / te", and the section end label Is given, but by the processing of the expression conversion unit 901, it is converted into “2 / two / method / use / use / use / is / masu”, and the end-of-section label is converted to the end-of-sentence label.

次に、第2の実施形態に係る表示制御部104による表示制御の具体例について図12に示す。図12に示すように、図7で表示されていたフィラーなどの冗長語が削除された表示が行われる。さらに、節末ラベルから文末ラベルに変換された分割文字列の表示1208の下の行には区切り線1209が表示される。これによって、ユーザにとってより字幕の内容を理解しやすい表示となる。   Next, a specific example of display control by the display control unit 104 according to the second embodiment is shown in FIG. As shown in FIG. 12, a display is performed in which redundant words such as fillers displayed in FIG. 7 have been deleted. Further, a dividing line 1209 is displayed in a line below the display 1208 of the divided character string converted from the section end label to the sentence end label. As a result, the display becomes easier for the user to understand the contents of the caption.

以上に示した第2の実施形態によれば、整文の処理を行うべく表現変換部が分割文字列の表現を変換することで、ユーザにとってより読みやすい字幕表示を行うことができ、ユーザが内容を理解することを支援できる。また、表現を方言などの別の表現に変換する場合には、字幕表示のバリエーションを広げることができる。   According to the second embodiment described above, the expression conversion unit converts the expression of the divided character string in order to perform the sentence processing, so that the subtitle display that is more readable for the user can be performed. Can assist in understanding the content. In addition, when converting an expression into another expression such as a dialect, it is possible to widen variations in subtitle display.

(第3の実施形態)
第3の実施形態に係る表示支援装置について図13のブロック図を参照して説明する。 第3の実施形態に係る表示支援装置1300は、取得部101、第1処理部102、第2処理部103、表示制御部104、表現変換部901および翻訳部1301を含む。 取得部101、第1処理部102、第2処理部103および表現変換部901の動作は第2の実施形態と同様であるので、ここでの説明を省略する。
(Third embodiment)
A display support device according to the third embodiment will be described with reference to the block diagram of FIG. The display support device 1300 according to the third embodiment includes an acquisition unit 101, a first processing unit 102, a second processing unit 103, a display control unit 104, an expression conversion unit 901 and a translation unit 1301. The operations of the acquisition unit 101, the first processing unit 102, the second processing unit 103, and the expression conversion unit 901 are the same as those in the second embodiment, and a description thereof will be omitted.

翻訳部1301は、表現変換部901から必要に応じて変換された複数の分割文字列を受け取り、複数の分割文字列を第1言語から第2言語に機械翻訳する。機械翻訳の手法は、規則ベース機械翻訳エンジン、用例ベース機械翻訳エンジンまたは統計ベース機械翻訳エンジンなど、一般的に用いられているあらゆる翻訳エンジンを用いることができる。 表示制御部104は、機械翻訳された複数の分割文字列について表示制御を行う。   The translation unit 1301 receives a plurality of divided character strings converted as necessary from the expression conversion unit 901 and performs machine translation of the plurality of divided character strings from the first language to the second language. The machine translation technique can use any commonly used translation engine, such as a rule-based machine translation engine, an example-based machine translation engine, or a statistics-based machine translation engine. The display control unit 104 performs display control on a plurality of machine-translated divided character strings.

次に、翻訳部1301の処理結果の一例について図14を参照して説明する。
図14は、図11に示す表現変換部901により表現が変換された分割文字列1101から分割文字列1110までに対して、機械翻訳処理が行われた例であり、ここでは、第1言語の日本語から第2言語の英語に翻訳する場合(日英翻訳という)を示す。分割文字列1401から分割1410までに示すように、分割文字列ごとに翻訳が可能となる。なお、既に付与されているラベルは、そのまま保持される。
Next, an example of the processing result of the translation unit 1301 will be described with reference to FIG.
FIG. 14 shows an example in which the machine translation process is performed on the divided character strings 1101 to 1110 whose expressions have been converted by the expression conversion unit 901 shown in FIG. A case of translating from Japanese to a second language English (referred to as Japanese-English translation) is shown. As shown in the divided character strings 1401 to 1410, translation can be performed for each divided character string. Note that the label that has already been given is kept as it is.

第3の実施形態に係る表示制御部104による表示制御の具体例について図15を参照して説明する。図15のように翻訳した内容が字幕表示されることで、第2言語を理解できるユーザにとっても内容を把握しやすくなる。   A specific example of display control by the display control unit 104 according to the third embodiment will be described with reference to FIG. By displaying the translated content as subtitles as shown in FIG. 15, it is easy for a user who can understand the second language to understand the content.

なお、第1言語から第2言語に翻訳する際に、第2言語の種類によっては翻訳単位となる分割文字列の長さを変更するほうが望ましい場合もある。例えば、日英翻訳と、日本語から中国語に翻訳する場合(日中翻訳という)とでは、翻訳単位をそれぞれの言語にあわせて設定するため、分割文字列として入力文字列を区切る位置(分割文字列の区切り位置)を変更するのが望ましい。   When translating from the first language to the second language, it may be desirable to change the length of the divided character string as a translation unit depending on the type of the second language. For example, in Japanese-English translation and when translating from Japanese to Chinese (referred to as Japanese-Chinese translation), the translation unit is set according to each language. It is desirable to change the character string separation position).

ここで、第2言語の種類に応じた文法の違いにより、第1言語の分割文字列の区切り位置が変わる第1例について図16Aおよび図16Bを参照して説明する。
図16Aは、日英翻訳の場合の機械翻訳例を示す。図16Bは、日中翻訳の場合の機械翻訳例を示す。
Here, a first example in which a delimiter position of a divided character string in the first language changes due to a difference in grammar according to the type of the second language will be described with reference to FIGS. 16A and 16B.
FIG. 16A shows an example of machine translation for Japanese-English translation. FIG. 16B shows an example of machine translation in the case of daytime translation.

図16Aに示す日英翻訳の場合、日本語では、分割文字列1601「それから最後に」と分割文字列1602「会議音声の活用システムということで」とに分割されるが、図16Bに示す日中翻訳の場合、日本語では、分割文字列1603「それから最後に会議音声の活用システムということで」と1つにまとめられる。   In the case of the Japanese-English translation shown in FIG. 16A, in Japanese, the character string is divided into a divided character string 1601 “and then finally” and a divided character string 1602 “in the context of a conference voice utilization system”. In the case of medium translation, in Japanese, the divided character string 1603 is combined into one, "and finally the system for utilizing the conference voice."

反対に、図16Aの日英翻訳の場合、分割文字列1604「音声を文字に起こしたり、翻訳をするといったところを実は我々の中で使ってみましょうということでトライアルの開始をしようとしてまして」と1つの分割文字列が、図16Bの日中翻訳において分割文字列1605「音声を文字に起こしたり、翻訳をするといったところを」、分割文字列1606「実は我々の中で使ってみましょうということで」および分割文字列1607の一部「トライアルの開始をしようとしてまして・・・」と分割される。   Conversely, in the case of the Japanese-English translation shown in FIG. 16A, the divisional character string 1604 "I tried to start the trial by actually using the place where the voice is transcribed or translated, etc. "And one divided string in the Japanese-Chinese translation of FIG. 16B, the divided string 1605" to transcribe or translate voice "and the divided string 1606" And a part of the divided character string 1607 "I'm trying to start a trial ...".

上述のような翻訳単位の決定は、翻訳部1301が、第2言語の種類に関する情報(目的言語情報ともいう)を受け取り、予め設定される言語の翻訳単位規則に基づいて、第2言語単位内の分割文字列を結合または分割する。目的言語情報は、ユーザから指定により取得してもよい。また、予め第2言語が決定していれば、分割文字列が生成される段階で、第1処理部102が翻訳単位規則を参照して分割文字列を生成してもよい。   In determining the translation unit as described above, the translating unit 1301 receives the information on the type of the second language (also referred to as target language information), and determines the translation unit in the second language unit based on a preset translation unit rule of the language. Join or split the split string of The target language information may be obtained from the user by designation. If the second language is determined in advance, the first processing unit 102 may generate the divided character string by referring to the translation unit rule at the stage of generating the divided character string.

次に、第2言語の文法の違いにより、第1言語の分割文字列の区切り位置が変わる第2例について図17Aおよび図17Bを参照して説明する。
図17Aは、日中翻訳の場合の機械翻訳例を示す。図17Bは、日英翻訳の場合の機械翻訳例を示す。
Next, a second example in which the delimiter positions of the divided character strings in the first language are changed due to differences in the grammar of the second language will be described with reference to FIGS. 17A and 17B.
FIG. 17A shows an example of machine translation in the case of day-to-day translation. FIG. 17B shows a machine translation example in the case of Japanese-English translation.

一般的に日中翻訳の場合は、中国語は日本語よりも文字数が少なくなることが多いので、日本語の内容に対応する中国語は字幕表示できる。一方、日英翻訳の場合は、日本語よりも文字数が多くなることがある。よって、字幕の表示スペースから文字がはみ出さないように、必須ではない内容を翻訳しないようにしてもよい。   In general, in the case of Japanese-Chinese translation, the number of characters in Chinese is often smaller than that in Japanese, so that Chinese corresponding to the Japanese content can be displayed with subtitles. On the other hand, in the case of Japanese-English translation, the number of characters may be larger than in Japanese. Therefore, in order to prevent characters from protruding from the caption display space, non-essential contents may not be translated.

図17Aに示す日中翻訳では、分割文字列1701「宜しく願いします」に対応する   In the day-to-day translation shown in FIG. 17A, the divided character string 1701 corresponds to “I wish you good”.

が翻訳されるが、図17Bに示す日英翻訳では、文字数を減らすべく、さらに対応する内容を表す翻訳も存在しないので、分割文字列1701「宜しく願いします」の翻訳が省略される。
翻訳部1301は、翻訳単位規則として翻訳文へ訳出しないキーワードを予め定めておき、図17Aおよび図17Bに示すような翻訳処理を行えばよい。
However, in the Japanese-English translation shown in FIG. 17B, since there is no translation indicating the corresponding content in order to reduce the number of characters, the translation of the divided character string 1701 “I wish you good” is omitted.
The translation unit 1301 may determine a keyword that is not translated into a translated sentence in advance as a translation unit rule, and perform a translation process as shown in FIGS. 17A and 17B.

翻訳部1301の処理の別例について図18Aおよび図18Bを参照して説明する。 図18Aは、日英翻訳の場合の機械翻訳例を示す。図18Bは、日中翻訳の場合の機械翻訳例を示す。   Another example of the process of the translation unit 1301 will be described with reference to FIGS. 18A and 18B. FIG. 18A shows an example of machine translation in the case of Japanese-English translation. FIG. 18B shows an example of machine translation for day-to-day translation.

第2言語の種類によっては、ある1つの分割文字列に対応する翻訳として、2つの分割文字列の翻訳文にわたって翻訳結果が反映したほうが自然な文となる場合がある。例えば、図18Aに示すように、翻訳部1301は、日本語の分割文字列1801「音声認識を我々はやってますので」を英語「as we are working on the speech recognition」に翻訳する。ここで、「ので」に対応する「as」は、対応する分割文字列の翻訳文として翻訳されればよい。
一方、図18Bに示すように、翻訳部1301は、日本語の分割文字列1801の「ので」を中国語に翻訳する場合は、
Depending on the type of the second language, there is a case where the translation corresponding to a certain one of the divided character strings is more natural when the translation result is reflected over the translated sentences of the two divided character strings. For example, as shown in FIG. 18A, the translation unit 1301 translates the Japanese divided character string 1801 “We are doing speech recognition” into English “as we are working on the speech recognition”. Here, "as" corresponding to "so" may be translated as a translation of the corresponding divided character string.
On the other hand, as shown in FIG. 18B, when translating “no” of the Japanese divided character string 1801 into Chinese,

との2つの分割文字列の翻訳文に出現するように翻訳する。翻訳部1301は、翻訳単位規則として、2つの分割文字列の翻訳文に出現させるべきキーワードを予め定めておき、図18Aおよび図18Bに示すような翻訳処理を行えばよい。 Is translated so as to appear in the translation of the two divided character strings. The translation unit 1301 may determine a keyword to appear in the translation of the two divided character strings in advance as a translation unit rule, and perform the translation processing as shown in FIGS. 18A and 18B.

以上に示した第3の実施形態によれば、第1言語から第2言語に翻訳した内容を表示させることで、第2言語を理解できるユーザにとっても内容を把握しやすくなり、ユーザが内容を理解することを支援することができる。   According to the third embodiment described above, by displaying the content translated from the first language to the second language, it becomes easy for a user who can understand the second language to understand the content, and the user can change the content. Can help you understand.

(第4の実施形態)
第4の実施形態に係る表示支援装置について図19のブロック図を参照して説明する。 第4の実施形態に係る表示支援装置1900は、取得部101、第1処理部102、第2処理部103、表示制御部104、表現変換部901、翻訳部1301および語順決定部1901を含む。
取得部101、第1処理部102、第2処理部103、表現変換部901および翻訳部1301の動作は第3の実施形態と同様であるので、ここでの説明を省略する。
(Fourth embodiment)
A display support device according to the fourth embodiment will be described with reference to the block diagram of FIG. The display support device 1900 according to the fourth embodiment includes an acquisition unit 101, a first processing unit 102, a second processing unit 103, a display control unit 104, an expression conversion unit 901, a translation unit 1301, and a word order determination unit 1901.
The operations of the acquiring unit 101, the first processing unit 102, the second processing unit 103, the expression converting unit 901 and the translating unit 1301 are the same as those in the third embodiment, and the description is omitted here.

語順決定部1901は、翻訳部1301から翻訳処理された分割文字列を受け取り、第2言語の語順決定規則に基づき、複数の分割文字列の表示順序を決定する。つまり、第2言語の文法順に沿って自然な順序となるように複数の分割文字列を並び替える。また、語順決定部1901は、必要に応じて末尾ラベルを付与し直す。なお、語順決定部1901は、第1言語の段階で倒置など順序が不自然な状態があれば、複数の分割文字列を並び替えてもよい。
表示制御部104は、並び替えられた分割文字列について表示制御を行う。
The word order determination unit 1901 receives the translated character string from the translation unit 1301, and determines the display order of the plurality of divided character strings based on the word order determination rule of the second language. That is, the plurality of divided character strings are rearranged in a natural order along the grammatical order of the second language. In addition, the word order determination unit 1901 reassigns a tail label as necessary. Note that the word order determination unit 1901 may rearrange a plurality of divided character strings if the order is unnatural such as inversion at the stage of the first language.
The display control unit 104 performs display control on the rearranged divided character strings.

次に、語順決定部1901で参照する語順決定規則の第1例について図20を参照して説明する。
図20に示す語順決定規則のテーブル2000は、第1言語の語順パターン2001と第2言語の語順パターン2002とを対応付けて格納する。図20の例では、第1言語が日本語であり、第2言語が英語である例を示す。ここでは、分割文字列に付与される役割ラベルの順序が英語の語順として自然な順序となるような役割ラベルの順序で決定される。
Next, a first example of a word order determination rule referred to by the word order determination unit 1901 will be described with reference to FIG.
The word order determination table 2000 shown in FIG. 20 stores a word order pattern 2001 of the first language and a word order pattern 2002 of the second language in association with each other. The example of FIG. 20 shows an example in which the first language is Japanese and the second language is English. Here, the order of the role labels given to the divided character strings is determined by the order of the role labels such that the order becomes natural as the English word order.

具体的には、例えば、日本語の語順パターン2001が「[sentence adverb]→[object]→[predicate]」と、英語の語順パターン2002が「[sentence adverb]→[predicate]→[object]」とが対応付けられる。   Specifically, for example, the Japanese word order pattern 2001 is “[sentence adverb] → [object] → [predicate]”, and the English word order pattern 2002 is “[sentence adverb] → [predicate] → [object]”. Are associated with each other.

次に、語順決定部1901の処理結果の一例について図21を参照して説明する。
語順を並び替える前の上述した図14の例では、第2言語単位中の分割文字列1401から分割文字列1403の順序が、「first[sentence adverb]」、「about machine translation [object]」、「we will introduce[predicate]<<節末>>」である。
Next, an example of the processing result of the word order determination unit 1901 will be described with reference to FIG.
In the example of FIG. 14 before the word order is rearranged, the order of the divided character strings 1401 to 1403 in the second language unit is “first [sentence adverb]”, “about machine translation [object]”, "We will introduce [predicate] << end of the end >>".

語順決定部1901は、語順決定規則に基づき、[sentence adverb]→[predicate]→[object]の順に分割文字列1401から分割文字列1403を並び替える。さらに語順決定部1901は、第2言語単位の最後の分割文字列に末尾ラベルを付与し直す。結果として、分割文字列2101から分割文字列2103までが、「first[sentence adverb]」「we will introduce[predicate]」「about machine translation[object]<<節末>>」の並びとなる。なお、末尾ラベルの付与し直しは、第2処理部103が行ってもよい。   The word order determination unit 1901 rearranges the divided character strings 1401 to 1403 in the order of [sentence adverb] → [predicate] → [object] based on the word order determination rule. Further, the word order determination unit 1901 reassigns a tail label to the last divided character string of the second language unit. As a result, the divided character strings 2101 to 2103 are arranged in the order of “first [sentence adverb]”, “we will introduce [predicate]”, “about machine translation [object] << end-of-section >>”. Note that the rearrangement of the end label may be performed by the second processing unit 103.

次に、第4の実施形態に係る表示制御部104による表示制御の具体例について図22を参照して説明する。
図22に示すように語順を変更した後は、翻訳文の表示順序が[first][we will introduce][about machine translation]の語順となるので、第2言語の文法として自然な順序で翻訳文が表示される。
Next, a specific example of display control by the display control unit 104 according to the fourth embodiment will be described with reference to FIG.
After the word order is changed as shown in FIG. 22, the display order of the translated sentences becomes the word order of [first], [we will introduce], and [about machine translation]. Is displayed.

以上に示した第4の実施形態によれば、語順決定部が第2言語の文法順に沿って自然な順序となるように複数の分割文字列を並び替えることで、第2言語を利用するユーザにより自然な字幕を表示させることができ、ユーザが内容を理解することを支援できる。   According to the fourth embodiment described above, the user who uses the second language sorts the plurality of divided character strings into a natural order along the grammatical order of the second language by the word order determination unit. Can display more natural subtitles, and can assist the user in understanding the contents.

(第5の実施形態)
第5の実施形態では、第1言語の話者が複数である場合を想定する。
第5の実施形態に係る表示支援装置は、上述の実施形態のいずれか1つに示す表示支援装置を用いて実現される。
(Fifth embodiment)
In the fifth embodiment, it is assumed that there are a plurality of speakers in the first language.
The display support device according to the fifth embodiment is realized by using the display support device described in any one of the above embodiments.

第5の実施形態に係る取得部101は、入力文字列に加えて、入力文字列を入力(発話)した話者を識別するための話者ごとに固有の話者情報を取得する。話者情報を取得する方法は、例えば、取得部101に接続されるマイクを話者ごとに用意することにより取得してもよいし、ビームフォーミングや音声特徴量を使った一般的な話者識別技術を用いて話者を識別し、話者情報を取得してもよい。   The acquisition unit 101 according to the fifth embodiment acquires unique speaker information for each speaker for identifying the speaker who has input (uttered) the input character string, in addition to the input character string. The method of acquiring the speaker information may be, for example, by preparing a microphone connected to the acquisition unit 101 for each speaker, or may be a general speaker identification using beamforming or voice feature. Techniques may be used to identify speakers and acquire speaker information.

また、第1処理部102は、取得部101から入力文字列および話者情報を受け取り、上述の実施形態と同様にして得られた複数の分割文字列に対して、話者情報に基づいて話者ごとに分類するための話者ラベルを付与する。   In addition, the first processing unit 102 receives the input character string and the speaker information from the acquisition unit 101, and performs a speech based on the speaker information for a plurality of divided character strings obtained in the same manner as in the above-described embodiment. A speaker label for classifying each speaker is provided.

表示制御部104は、第2処理部103から話者ラベルが付与された複数の分割文字列を受け取り、複数の分割文字列を表示させる場合に、話者ラベルに基づいて、話者ごとに区別しつつ、第1言語単位および第2言語単位を区別する表示制御を行う。   The display control unit 104 receives a plurality of divided character strings to which a speaker label has been assigned from the second processing unit 103 and, when displaying the plurality of divided character strings, distinguishes each speaker based on the speaker label. While performing the display control, the first language unit and the second language unit are distinguished.

第5の実施形態に係る第1処理部102の処理結果の一例について図23に示す。
図23に示すように、役割ラベル202、末尾ラベル402に加えて、話者ラベル2300が付与される。
話者ラベルの決定方法は、例えば取得部101が取得した話者情報に基づいて、予めユーザの識別情報(IPアドレスや、ユーザIDが含まれるユーザの識別情報など)が得られる場合は、識別情報に従って識別してもよいし、話者A、話者Bなど、異なる話者情報であることが区別できるラベルを付与してもよい。
FIG. 23 illustrates an example of a processing result of the first processing unit 102 according to the fifth embodiment.
As shown in FIG. 23, a speaker label 2300 is provided in addition to the role label 202 and the end label 402.
The method of determining a speaker label is, for example, based on the speaker information acquired by the acquisition unit 101, when the identification information of the user (such as the IP address or the identification information of the user including the user ID) is obtained in advance. The information may be identified according to the information, or a label such as speaker A or speaker B may be given to distinguish different speaker information.

次に、第5の実施形態に係る表示制御部104の動作について図24のフローチャートを参照して説明する。
ステップS601、ステップS603からステップS607まで、およびステップS609の処理は、上述の実施形態と同様であるので、説明を省略する。
Next, the operation of the display control unit 104 according to the fifth embodiment will be described with reference to the flowchart in FIG.
The processing of step S601, steps S603 to S607, and step S609 is the same as that of the above-described embodiment, and thus the description is omitted.

ステップS2401では、表示制御部104が、新しい吹き出しを用意する。
ステップS2402では、表示制御部104が、分割文字列に文末ラベルが付与されているので、現在の吹き出しを終了し、インデント数をゼロに設定する。また、ステップS2401に戻り、同様の処理を繰り返す。これにより、1つの文が、1つの吹き出しで表現されることになる。
ステップS2403では、全ての分割文字列について処理が終了したので、吹き出しを終了する。また、ステップS2401に戻り、同様の処理を繰り返す。
In step S2401, the display control unit 104 prepares a new balloon.
In step S2402, the display control unit 104 ends the current speech balloon and sets the number of indents to zero since the end of sentence label is assigned to the divided character string. The process returns to step S2401, and the same processing is repeated. Thus, one sentence is represented by one balloon.
In step S2403, since the processing has been completed for all the divided character strings, the balloon ends. The process returns to step S2401, and the same processing is repeated.

なお、話者ごとに吹き出しの枠線および枠線の色を変更するなど、話者の区別を明確にする処理を行ってもよい。また、第5の実施形態では、話者の区別に吹き出しを想定しているが、話者ごとに区別できればどのような表示でもよい。   Note that a process for clarifying the distinction between speakers may be performed, such as changing the frame line of the speech balloon and the color of the frame line for each speaker. Further, in the fifth embodiment, speech balloons are assumed for speaker identification, but any display may be used as long as it can be identified for each speaker.

次に、第5の実施形態に係る表示制御部104による表示制御の具体例について図25に示す。
図25は、図23に示す第2処理部103の処理結果に対して表示制御を行った例である。話者Aの発言については吹き出し2501、話者Bの発言については吹き出し2502、話者Cの発言については吹き出し2503といったように、話者ごと、さらに文ごとに吹き出しが表示されることとなり、字幕の視認性を向上させることができる。
Next, a specific example of display control by the display control unit 104 according to the fifth embodiment is shown in FIG.
FIG. 25 is an example in which display control is performed on the processing result of the second processing unit 103 shown in FIG. A balloon is displayed for each speaker and further for each sentence, such as a balloon 2501 for the utterance of the speaker A, a balloon 2502 for the utterance of the speaker B, and a balloon 2503 for the utterance of the speaker C. Can be improved.

(第5の実施形態の第1の変形例)
第5の実施形態の第1の変形例に係る表示制御部104の動作について図26のフローチャートを参照して説明する。
ステップS604、ステップS605、ステップS607、ステップS2401およびステップS2403の処理は、上述の実施形態と同様であるので説明を省略する。
(First Modification of Fifth Embodiment)
The operation of the display control unit 104 according to the first modification of the fifth embodiment will be described with reference to the flowchart in FIG.
The processing of step S604, step S605, step S607, step S2401, and step S2403 is the same as that of the above-described embodiment, and thus the description is omitted.

ステップS2601では、表示制御部104が、分割文字列の内容を、吹き出しより小さい囲みで、吹き出しに収まるサイズの囲み内に表示する。
ステップS2602では、表示制御部104が、現在の吹き出しを終了し、ステップS2401に戻り同様の処理を繰り返す。
ステップS2603では、表示制御部104が、空行を表示し、ステップS2601に戻り同様の処理を繰り返す。
In step S2601, the display control unit 104 displays the content of the divided character string in a box smaller than the balloon and within a size that fits in the balloon.
In step S2602, the display control unit 104 ends the current balloon, returns to step S2401, and repeats the same processing.
In step S2603, the display control unit 104 displays a blank line, returns to step S2601, and repeats the same processing.

次に、第5の実施形態の第1の変形例に係る表示制御部104による表示制御の具体例について図27に示す。
図27に示すように、吹き出し内において分割文字列が囲み2701で表示されるので、字幕の視認性を向上させることができる。
Next, a specific example of display control by the display control unit 104 according to a first modification of the fifth embodiment is shown in FIG.
As shown in FIG. 27, the divided character strings are displayed in a box 2701 in the balloon, so that the visibility of the subtitles can be improved.

(第5の実施形態の第2の変形例)
第5の実施形態の第2の変形例について図28のフローチャートを参照して説明する。 ステップS603からステップS605まで、ステップS607、ステップS2401、ステップS2403およびステップS2603の処理は、上述の実施形態と同様であるので説明を省略する。
(Second Modification of Fifth Embodiment)
A second modification of the fifth embodiment will be described with reference to the flowchart in FIG. Steps S607, S2401, S2403, and S2603 from step S603 to step S605 are the same as those in the above-described embodiment, and thus description thereof is omitted.

ステップS2801では、表示制御部104が、節末ラベルまたは文末ラベルが付与されていない場合、分割文字列の末尾に句点を表示する。
ステップS2802では、表示制御部104が、分割文字列の末尾に読点を表示し、現在の吹き出しを終了したのち、ステップS2401に戻り同様の処理を繰り返す。
In step S2801, the display control unit 104 displays a period at the end of the divided character string when the end-of-section label or the end-of-sentence label is not assigned.
In step S2802, the display control unit 104 displays a reading point at the end of the divided character string, ends the current balloon, and returns to step S2401 to repeat the same processing.

次に、第5の実施形態の第2の変形例に係る表示例について図29に示す。
図29においても、図27と同様に、吹き出し内において分割文字列が句読点で表示されるので、字幕の視認性を向上させることができる。
Next, FIG. 29 shows a display example according to a second modification of the fifth embodiment.
Also in FIG. 29, similar to FIG. 27, the divided character strings are displayed with punctuation marks in the balloon, so that the visibility of the subtitles can be improved.

次に、表現変換部901により表現が変換された場合の表示制御の別例について図30に示す。
図30は、図23の分割文字列2309が、表現変換部901により変換され、併せて付与されていたラベルが節末ラベルから文末ラベルに付け替えられた場合である。表示制御部104は、分割文字列3001の文字列の色を変更する。
Next, another example of the display control when the expression is converted by the expression conversion unit 901 is shown in FIG.
FIG. 30 shows a case where the divided character string 2309 in FIG. 23 is converted by the expression conversion unit 901, and the attached label is changed from a section end label to a sentence end label. The display control unit 104 changes the color of the character string of the divided character string 3001.

次に、表現変換部901により表現が変換された場合の表示の別例について図31に示す。このように、変換された箇所の色を変更することで、ユーザは変更があった箇所を容易に把握することができる。なお、色を変更することに限らず、下線を引いたり、斜体にしたりしてもよい。   Next, another example of the display when the expression is converted by the expression conversion unit 901 is shown in FIG. As described above, by changing the color of the converted portion, the user can easily grasp the changed portion. The color is not limited to being changed, and may be underlined or italicized.

以上に示した第5の実施形態によれば、複数のユーザからの入力に対して、吹き出しを用いて話者ごとに発言を分離し、さらに吹き出し内において分割文字列について上述の実施形態のような表示制御を行うことで、話者ごとの区別が容易となり、ユーザが内容を理解することを支援できる。   According to the fifth embodiment described above, in response to input from a plurality of users, speech is separated for each speaker using a speech balloon, and further, a divided character string in the speech balloon is the same as in the above-described embodiment. Performing the appropriate display control makes it easy to distinguish between speakers, and can assist the user in understanding the contents.

上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した表示支援装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RW、Blu−ray(登録商標)Discなど)、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の表示支援装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
The instructions shown in the processing procedure shown in the above-described embodiment can be executed based on a program that is software. A general-purpose computer system stores this program in advance, and by reading this program, it is possible to obtain the same effect as the above-described effect of the display support device. The instructions described in the above-described embodiments are, as programs that can be executed by a computer, magnetic disks (flexible disks, hard disks, etc.) and optical disks (CD-ROM, CD-R, CD-RW, DVD-ROM, DVD ± R, DVD ± RW, Blu-ray (registered trademark) Disc, etc.), a semiconductor memory, or a recording medium similar thereto. As long as the recording medium is readable by a computer or an embedded system, its storage format may be any. If the computer reads the program from the recording medium and causes the CPU to execute the instructions described in the program based on the program, the same operation as the display support device of the above-described embodiment can be realized. Of course, when the computer acquires or reads the program, the program may be acquired or read through a network.
Also, an OS (Operating System) running on the computer, database management software, MW (Middleware) such as a network, etc., based on instructions of a program installed in the computer or the embedded system from the recording medium realizes the present embodiment. May be executed.
Further, the recording medium in the present embodiment is not limited to a medium independent of a computer or an embedded system, but also includes a recording medium in which a program transmitted via a LAN, the Internet, or the like is downloaded and stored or temporarily stored.
Further, the number of recording media is not limited to one, and a case where the processing in the present embodiment is executed from a plurality of media is also included in the recording medium in the present embodiment, and the configuration of the medium may be any configuration.

なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
Note that the computer or the embedded system according to the present embodiment is for executing each process according to the present embodiment based on a program stored in a recording medium, and includes an apparatus including one such as a personal computer and a microcomputer. This device may have any configuration such as a system in which the devices are connected to a network.
Further, the computer in the present embodiment is not limited to a personal computer, but also includes an arithmetic processing unit, a microcomputer, and the like included in an information processing device, and is a general term for devices and devices that can realize the functions in the present embodiment by programs. ing.

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行なうことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   Although several embodiments of the present invention have been described, these embodiments are provided by way of example and are not intended to limit the scope of the invention. These new embodiments can be implemented in other various forms, and various omissions, replacements, and changes can be made without departing from the spirit of the invention. These embodiments and their modifications are included in the scope and gist of the invention, and are also included in the invention described in the claims and their equivalents.

100,900,1300,1900・・・表示支援装置、101・・・取得部、102・・・第1処理部、103・・・第2処理部、104・・・表示制御部、200,400,1000,2000・・・テーブル、201・・・第1言語単位検出パターン、202・・・役割ラベル、301〜310,501〜510,1101〜1110,1401〜1410,1601〜1607,1701,1801,2101〜2110,2301〜2312,3001・・・分割文字列、401・・・第2言語単位検出パターン、402・・・末尾ラベル、701〜703,705〜708,710〜712,1201〜1203,1205〜1208,1210〜1212,1501〜1503,1505〜1508,1510〜1512,2201〜2203,2205〜2208,2210〜2212・・・表示、704,709,1204,1504,2204・・・空行、700,713,1200,1209,1213,1500,1509,1513,2200,2209,2213・・・区切り線、901・・・表現変換部、1001・・・変換対象パターン、1002・・・変換パターン、1301・・・翻訳部、1802,1803・・・翻訳文、1901・・・語順決定部、2001・・・第1言語の語順パターン、2002・・・第2言語の語順パターン、2300・・・話者ラベル、2501,2502,2503・・・吹き出し、2701・・・囲み。   100, 900, 1300, 1900: display support device, 101: acquisition unit, 102: first processing unit, 103: second processing unit, 104: display control unit, 200, 400 , 1000, 2000 ... table, 201 ... first language unit detection pattern, 202 ... role label, 301-310, 501-510, 1101-1110, 1401-1410, 1601-1607, 1701, 1801 , 2101 to 2110, 2301 to 2312, 3001 ... divided character string, 401 ... second language unit detection pattern, 402 ... tail label, 701 to 703, 705 to 708, 710 to 712, 1201 to 1203 , 1205-1208, 1210-1212, 1501-1503, 1505-1508, 1510-1512, 201 to 2203, 2205 to 2208, 2210 to 2212 ... display, 704, 709, 1204, 1504, 2204 ... blank line, 700, 713, 1200, 1209, 1213, 1500, 1509, 1513, 2200, 2209 , 2213 ... Separation line, 901 ... Expression conversion unit, 1001 ... Conversion target pattern, 1002 ... Conversion pattern, 1301 ... Translation unit, 1802, 1803 ... Translation sentence, 1901 ... Word order determination unit, 2001: Word order pattern of the first language, 2002: Word order pattern of the second language, 2300: Speaker label, 2501, 502, 2503 ... Balloon, 2701 ... Box .

Claims (11)

文字列を取得する取得部と、
前記文字列を意味のまとまりを表す単位である第1単位で分割し、複数の分割文字列を生成する第1処理部と、
前記複数の分割文字列のうちの第1文字列にそれぞれ役割ラベルを付与する第1付与部と、
前記文字列について前記第1単位よりも大きい単位である第2単位を検出する第2処理部と、
前記複数の分割文字列のうちの、前記第2単位の末尾にある第2文字列に末尾ラベルを付与する第2付与部と、
前記複数の分割文字列を表示させる場合に、分割文字列ごとに前記末尾ラベルが付与されているかどうかと、前記役割ラベルが示す特徴とに基づいて前記第1単位および前記第2単位を区別する表示制御を行う表示制御部と、を具備し、
前記役割ラベルは前記第1文字列の役割を表現し、前記役割は、第1単位のうちの1つとして使用されるポーズ情報と、第1単位のうちの1つとして使用される確定情報と、を含み、
前記第2処理部は、前記役割ラベルと、前記ポーズ情報または前記確定情報との並びを検出し、節末と文末のうちの1つを決定する表示支援装置。
An acquisition unit for acquiring a character string;
A first processing unit that divides the character string by a first unit that is a unit representing a unit of meaning and generates a plurality of divided character strings;
A first assigning unit that assigns a role label to each of the first character strings of the plurality of divided character strings;
A second processing unit that detects a second unit that is a unit larger than the first unit for the character string;
A second assigning unit that assigns an end label to a second character string at the end of the second unit of the plurality of divided character strings;
When displaying the plurality of divided character strings, the first unit and the second unit are distinguished based on whether the end label is assigned to each divided character string and the feature indicated by the role label. A display control unit that performs display control,
The role label represents a role of the first character string, and the role includes pause information used as one of the first units and determination information used as one of the first units. , Including
The display support device, wherein the second processing unit detects an arrangement of the role label and the pause information or the determination information, and determines one of a clause end and a sentence end.
変換規則に基づいて、前記分割文字列の表現を別の表現に変換する変換部をさらに具備し、
前記表示制御部は、変換された前記分割文字列について表示制御を行う請求項1に記載の表示支援装置。
A conversion unit configured to convert the expression of the divided character string into another expression based on a conversion rule;
The display support device according to claim 1, wherein the display control unit performs display control on the converted divided character string.
前記表示制御部は、前記複数の分割文字列を表示させる場合に、第1分割文字列に続く第2分割文字列をインデントして表示させる処理を行い、該第2分割文字列が前記第2単位の末尾に位置する場合、該第2分割文字列を表示させた後に空行を表示させる処理を行う請求項1または請求項2に記載の表示支援装置。   When displaying the plurality of divided character strings, the display control unit performs a process of indenting and displaying a second divided character string following the first divided character string, and the second divided character string is the second divided character string. The display support device according to claim 1, wherein when the unit is located at the end of the unit, a process of displaying a blank line after displaying the second divided character string is performed. 前記複数の分割文字列を第1言語から第2言語に機械翻訳する翻訳部をさらに具備し、
前記表示制御部は、機械翻訳された分割文字列について表示制御を行う請求項1から請求項3のいずれか1項に記載の表示支援装置。
A translation unit configured to machine translate the plurality of divided character strings from a first language to a second language;
The display support device according to any one of claims 1 to 3, wherein the display control unit performs display control on the machine-translated divided character string.
前記第2言語の語順決定規則に基づいて、前記複数の分割文字列の表示順序を決定する決定部をさらに具備し、
前記表示制御部は、前記表示順序が決定された分割文字列について表示制御を行う請求項4に記載の表示支援装置。
A determining unit configured to determine a display order of the plurality of divided character strings based on a word order determining rule of the second language;
The display support device according to claim 4, wherein the display control unit performs display control on the divided character string in which the display order is determined.
前記文字列は、音声認識結果の文字列である請求項1から請求項5のいずれか1項に記載の表示支援装置。   The display support device according to claim 1, wherein the character string is a character string obtained as a result of speech recognition. 前記第1単位は句であり、前記第2単位は節または文である請求項1から請求項6のいずれか1項に記載の表示支援装置。   The display support device according to any one of claims 1 to 6, wherein the first unit is a phrase, and the second unit is a clause or a sentence. 前記第1単位は単文であり、前記第2単位は重文である請求項1から請求項6のいずれか1項に記載の表示支援装置。   The display support device according to any one of claims 1 to 6, wherein the first unit is a simple sentence, and the second unit is a compound sentence. 前記取得部は、話者ごとの話者情報をさらに取得し、
前記表示制御部は、前記話者ごとに区別して表示制御を行う請求項1から請求項8のいずれか1項に記載の表示支援装置。
The acquisition unit further acquires speaker information for each speaker,
The display support device according to any one of claims 1 to 8, wherein the display control unit performs display control separately for each speaker.
文字列を取得し、
前記文字列を意味のまとまりを表す単位である第1単位で分割し、複数の分割文字列を生成し、
前記複数の分割文字列のうちの第1文字列にそれぞれ役割ラベルを付与し、
前記文字列について前記第1単位よりも大きい単位である第2単位を検出し、
前記複数の分割文字列のうちの、前記第2単位の末尾にある第2文字列に末尾ラベルを付与し、
前記複数の分割文字列を表示させる場合に、分割文字列ごとに前記末尾ラベルが付与されているかどうかと、前記役割ラベルが示す特徴とに基づいて前記第1単位および前記第2単位を区別する表示制御を行い、
前記役割ラベルは前記第1文字列の役割を表現し、前記役割は、第1単位のうちの1つとして使用されるポーズ情報と、第1単位のうちの1つとして使用される確定情報と、を含み、
前記第2単位を検出することは、前記役割ラベルと、前記ポーズ情報または前記確定情報との並びを検出し、節末と文末のうちの1つを決定する表示支援方法。
Get a string,
Dividing the character string by a first unit which is a unit representing a unit of meaning, generating a plurality of divided character strings,
Assigning a role label to each of the first character strings of the plurality of divided character strings,
Detecting a second unit, which is a unit larger than the first unit, for the character string;
An end label is assigned to a second character string at the end of the second unit of the plurality of divided character strings,
When displaying the plurality of divided character strings, the first unit and the second unit are distinguished based on whether the end label is assigned to each divided character string and the feature indicated by the role label. Perform display control,
The role label represents a role of the first character string, and the role includes pause information used as one of the first units and determination information used as one of the first units. , Including
Detecting the second unit is a display support method for detecting an arrangement of the role label and the pause information or the determination information and determining one of a clause end and a sentence end.
コンピュータを、
文字列を取得する取得手段と、
前記文字列を意味のまとまりを表す単位である第1単位で分割し、複数の分割文字列を生成する第1処理手段と、
前記複数の分割文字列のうちの第1文字列にそれぞれ役割ラベルを付与する第1付与手段と、
前記文字列について前記第1単位よりも大きい単位である第2単位を検出する第2処理手段と、
前記複数の分割文字列のうちの、前記第2単位の末尾にある第2文字列に末尾ラベルを付与する第2付与手段と、
前記複数の分割文字列を表示させる場合に、分割文字列ごとに前記末尾ラベルが付与されているかどうかと、前記役割ラベルが示す特徴とに基づいて前記第1単位および前記第2単位を区別する表示制御を行う表示制御手段として機能させるためのプログラムであって、
前記役割ラベルは前記第1文字列の役割を表現し、前記役割は、第1単位のうちの1つとして使用されるポーズ情報と、第1単位のうちの1つとして使用される確定情報と、を含み、
前記第2処理手段は、前記役割ラベルと、前記ポーズ情報または前記確定情報との並びを検出し、節末と文末のうちの1つを決定する表示支援プログラム。
Computer
Acquisition means for acquiring a character string;
First processing means for dividing the character string by a first unit which is a unit representing a unit of meaning and generating a plurality of divided character strings;
First assigning means for assigning a role label to each of the first character strings of the plurality of divided character strings;
A second processing unit that detects a second unit of the character string that is larger than the first unit;
Second assigning means for assigning an end label to a second character string at the end of the second unit of the plurality of divided character strings,
When displaying the plurality of divided character strings, the first unit and the second unit are distinguished based on whether the end label is assigned to each divided character string and the feature indicated by the role label. A program for functioning as display control means for performing display control,
The role label represents a role of the first character string, and the role includes pause information used as one of the first units and determination information used as one of the first units. , Including
The second processing means is a display support program for detecting an arrangement of the role label and the pause information or the determination information, and determining one of a section end and a sentence end.
JP2019215343A 2016-03-16 2019-11-28 Display support devices, methods and programs Active JP6926175B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019215343A JP6926175B2 (en) 2016-03-16 2019-11-28 Display support devices, methods and programs

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016052394A JP2017167805A (en) 2016-03-16 2016-03-16 Display support device, method and program
JP2019215343A JP6926175B2 (en) 2016-03-16 2019-11-28 Display support devices, methods and programs

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016052394A Division JP2017167805A (en) 2016-03-16 2016-03-16 Display support device, method and program

Publications (2)

Publication Number Publication Date
JP2020057401A true JP2020057401A (en) 2020-04-09
JP6926175B2 JP6926175B2 (en) 2021-08-25

Family

ID=70107462

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019215343A Active JP6926175B2 (en) 2016-03-16 2019-11-28 Display support devices, methods and programs

Country Status (1)

Country Link
JP (1) JP6926175B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022030595A1 (en) * 2020-08-07 2022-02-10 株式会社東芝 Input assistance system, input assistance method, and program

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05151256A (en) * 1991-11-29 1993-06-18 Hitachi Ltd Machine translation method and its system
JPH05189480A (en) * 1992-01-14 1993-07-30 Nec Corp Speech data processor
JPH09106399A (en) * 1995-08-08 1997-04-22 Matsushita Electric Ind Co Ltd Device and method for machine translation
JPH10307823A (en) * 1997-05-09 1998-11-17 Yuuna:Kk Translation method, translation device and recording medium storing translation program
JP2001075957A (en) * 1999-08-24 2001-03-23 Internatl Business Mach Corp <Ibm> Display method and device for structure of natural language
JP2007018098A (en) * 2005-07-05 2007-01-25 Advanced Telecommunication Research Institute International Text division processor and computer program
US20100128042A1 (en) * 2008-07-10 2010-05-27 Anthony Confrey System and method for creating and displaying an animated flow of text and other media from an input of conventional text
JP2012059227A (en) * 2010-09-13 2012-03-22 Ricoh Co Ltd Document dividing apparatus, document processing system, and program

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05151256A (en) * 1991-11-29 1993-06-18 Hitachi Ltd Machine translation method and its system
JPH05189480A (en) * 1992-01-14 1993-07-30 Nec Corp Speech data processor
JPH09106399A (en) * 1995-08-08 1997-04-22 Matsushita Electric Ind Co Ltd Device and method for machine translation
JPH10307823A (en) * 1997-05-09 1998-11-17 Yuuna:Kk Translation method, translation device and recording medium storing translation program
JP2001075957A (en) * 1999-08-24 2001-03-23 Internatl Business Mach Corp <Ibm> Display method and device for structure of natural language
JP2007018098A (en) * 2005-07-05 2007-01-25 Advanced Telecommunication Research Institute International Text division processor and computer program
US20100128042A1 (en) * 2008-07-10 2010-05-27 Anthony Confrey System and method for creating and displaying an animated flow of text and other media from an input of conventional text
JP2012059227A (en) * 2010-09-13 2012-03-22 Ricoh Co Ltd Document dividing apparatus, document processing system, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022030595A1 (en) * 2020-08-07 2022-02-10 株式会社東芝 Input assistance system, input assistance method, and program
US11983465B2 (en) 2020-08-07 2024-05-14 Kabushiki Kaisha Toshiba Input assistance system, input assistance method, and non-volatile recording medium storing program

Also Published As

Publication number Publication date
JP6926175B2 (en) 2021-08-25

Similar Documents

Publication Publication Date Title
KR101990023B1 (en) Method for chunk-unit separation rule and display automated key word to develop foreign language studying, and system thereof
JP3848319B2 (en) Information processing method and information processing apparatus
US20080208597A1 (en) Apparatus, method, and computer program product for processing input speech
US20090006087A1 (en) Synchronization of an input text of a speech with a recording of the speech
JPH03224055A (en) Method and device for input of translation text
CN110740275B (en) Nonlinear editing system
EP4322029A1 (en) Method and apparatus for generating video corpus, and related device
JPWO2004081813A1 (en) Translation support device
JP2007018098A (en) Text division processor and computer program
JP6926175B2 (en) Display support devices, methods and programs
WO2018198807A1 (en) Translation device
KR101990019B1 (en) Terminal for performing hybrid caption effect, and method thereby
KR20160002081A (en) Apparatus and method for translating of sign language using speech recognition
US20230069113A1 (en) Text Summarization Method and Text Summarization System
JP2017167805A (en) Display support device, method and program
JP2006236037A (en) Voice interaction content creation method, device, program and recording medium
CN110782899B (en) Information processing apparatus, storage medium, and information processing method
KR20110137961A (en) Apparatus and method for translating using overlay of the original and translation
KR102107447B1 (en) Text to speech conversion apparatus for providing a translation function based on application of an optional speech model and operating method thereof
JP4643183B2 (en) Translation apparatus and translation program
WO2009144890A1 (en) Pre-translation rephrasing rule generating system
JP2002123281A (en) Speech synthesizer
WO2023047623A1 (en) Information processing device, information processing method, and information processing program
JP3414326B2 (en) Speech synthesis dictionary registration apparatus and method
JP2008269122A (en) Processing unit dividing device, processing unit dividing method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210804

R151 Written notification of patent or utility model registration

Ref document number: 6926175

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151