WO2023100433A1

WO2023100433A1 - 文字列出力装置

Info

Publication number: WO2023100433A1
Application number: PCT/JP2022/033330
Authority: WO
Inventors: 謙吾竹谷; 憲卓岡本; 心語郭
Original assignee: 株式会社Ｎｔｔドコモ
Priority date: 2021-11-30
Filing date: 2022-09-05
Publication date: 2023-06-08
Also published as: JPWO2023100433A1

Abstract

順次取得した文字列について文末までの文字列を出力することを課題とする。文字列出力装置１は、文字列を順次取得する取得部１２と、判定対象の文字列である対象文字列について文末が含まれるか否かの判定を繰り返し行う判定部１３であって、初回の判定において、取得部１２によって最初に取得された文字列を対象文字列として判定を行い、初回以降の判定において、前回の判定において対象文字列に文末が含まれないと判定された場合は、当該対象文字列と、取得部１２によって続いて取得された文字列とを含む新たな対象文字列について判定を行う、判定部１３と、判定部１３によって対象文字列に文末が含まれると判定された場合、当該対象文字列のうち文末までの文字列を出力する出力部１４と、を備える。

Description

文字列出力装置

　本開示の一側面は、順次取得した文字列について文末までの文字列を出力する文字列出力装置に関する。

　下記特許文献１では、ユーザの発話を順次取得して音声認識し、音声認識結果としてユーザの発話内容を表す文字列を生成する検出装置が開示されている。

特開２０１７－０５８８０４号公報

　一般的に、音声認識では無音区間が一定時間継続すると、そこを文区切り位置と判定し、無音区間までの発話に対応する文字列が１つの音声認識結果として出力される。そのため、話し方によっては、本来１文となってほしい文の途中で文が区切られることがある。例えば、上記検出装置によって生成される文字列を順次取得した場合、取得した文字列が文末で終わっていない可能性がある。

　文の意味としては１文として処理すべきだが、音声認識の仕組みなどによって、文末で終わっていないなどの不適切な文字列は解釈しづらく、例えば翻訳をする場合には翻訳結果が意図しないものとなる。そこで、順次取得した文字列について文末までの文字列を出力することが望まれている。

　本開示の一側面に係る文字列出力装置は、文字列を順次取得する取得部と、判定対象の文字列である対象文字列について文末が含まれるか否かの判定を繰り返し行う判定部であって、初回の判定において、取得部によって最初に取得された文字列を対象文字列として判定を行い、初回以降の判定において、前回の判定において対象文字列に文末が含まれないと判定された場合は、当該対象文字列と、取得部によって続いて取得された文字列とを含む新たな対象文字列について判定を行う、判定部と、判定部によって対象文字列に文末が含まれると判定された場合、当該対象文字列のうち文末までの文字列を出力する出力部と、を備える。

　このような側面においては、順次取得される文字列が含まれる対象文字列について文末が含まれるか否かの判定が行われ、対象文字列に文末が含まれると判定された場合、当該対象文字列のうち文末までの文字列が出力される。すなわち、順次取得した文字列について文末までの文字列を出力することができる。

　本開示の一側面によれば、順次取得した文字列について文末までの文字列を出力することができる。

実施形態に係る文字列出力装置の機能構成の一例を示す図である。学習データの一例を示す図である。学習データの生成方法の一例を示す図である。系列ラベリングにおけるラベルが付与されている学習データの一例を示す図である。実施形態に係る文字列出力装置が実行する文字列出力処理の一例（その１）を示すフローチャートである。実施形態に係る文字列出力装置が実行する文字列出力処理の一例（その２）を示すフローチャートである。実施形態に係る文字列出力装置が実行する文字列出力処理の一例（その３）を示すフローチャートである。図７の音声認識結果に対する従来技術による音声翻訳結果の一例を示す図である。従来技術による機械翻訳の一例を示す図である。実施形態に係る文字列出力装置による機械翻訳の一例を示す図である。従来技術による音声認識の課題（その１）を示す図である。従来技術による音声認識の課題（その２）を示す図である。実施形態に係る文字列出力装置で用いられるコンピュータのハードウェア構成の一例を示す図である。

　以下、図面を参照しながら本開示での実施形態を詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。また、以下の説明における本開示での実施形態は、本発明の具体例であり、特に本発明を限定する旨の記載がない限り、これらの実施形態に限定されないものとする。

　実施形態に係る文字列出力装置１は、文字列を出力するコンピュータ装置である。文字列は、１つ以上の文字で構成される。実施形態において、文字列は日本語を想定するが、これに限るものではなく、英語などの日本語以外の言語であってもよい。

　文字列出力装置１は、音声認識を行う音声認識装置又は文字認識を行う文字認識装置から、認識結果である文字列を取得する。音声認識装置又は文字認識装置では、順次入力される音声又は文字に対してリアルタイムに音声認識又は文字認識が行われる。それゆえ、文字列出力装置１は、認識結果である文字列を、音声認識又は文字認識が行われるたびに順次取得する。

　ここで、順次取得した文字列は、上述したように、音声認識又は文字認識の仕組みなどによって、文末で終わっていない可能性がある。文末とは、文の終わりの部分である。文末は、文末を示す記号である文末記号で表される場合もある。文末記号の一例として、日本語の場合、「。」、「！」及び「？」などが挙げられる。文字列出力装置１は、順次取得した文字列が文末で終わっていない場合でも、文末までの文字列を出力する。文字列出力装置１の機能の詳細については以降で説明する。

　図１は、文字列出力装置１の機能構成の一例を示す図である。図１に示す通り、文字列出力装置１は、格納部１０、学習部１１、取得部１２（取得部）、判定部１３（判定部）、出力部１４（出力部）及び翻訳部１５（翻訳部）を含んで構成される。

　文字列出力装置１の各機能ブロックは、文字列出力装置１内にて機能することを想定しているが、これに限るものではない。例えば、文字列出力装置１の機能ブロックの一部は、文字列出力装置１とは異なるコンピュータ装置であって、文字列出力装置１とネットワーク接続されたコンピュータ装置内において、文字列出力装置１と情報を適宜送受信しつつ機能してもよい。また、文字列出力装置１の一部の機能ブロックは無くてもよいし、複数の機能ブロックを一つの機能ブロックに統合してもよいし、一つの機能ブロックを複数の機能ブロックに分解してもよい。

　以下、図１に示す文字列出力装置１の各機能について説明する。

　格納部１０は、文字列出力装置１における算出などで利用される任意の情報及び文字列出力装置１における算出の結果などを格納する。格納部１０によって格納された情報は、文字列出力装置１の各機能によって適宜参照されてもよい。

　格納部１０は、文を区切る記号である文区切り記号（又は文末記号）のない文字列を入力すると文区切り記号（又は文末記号）が挿入された文字列を出力する文末記号挿入モデルを格納してもよい。文区切り記号の一例として、「、」、「。」、「！」及び「？」などが挙げられる。例えば、文末記号挿入モデルは、文区切り記号のない文字列「さて会議を始めます」を入力すると文区切り記号が挿入された文字列「さて、会議を始めます。」を出力する。文末記号挿入モデルは、既存技術によって生成されてもよい。

　文末記号挿入モデルは、文区切り記号（又は文末記号）のない文字列と文区切り記号（又は文末記号）のある文字列との組である学習データに基づいて（機械）学習された学習済みモデルであってもよい。

　図２は、学習データの一例を示す図である。図２に示す学習データでは、文区切り記号のない文字列と文区切り記号のある文字列とが組として対応付いている。なお、図２に示す学習データでは、１つの文（文章）の全部又は一部の例を挙げているが、これに限るものではなく、例えば２つ以上の文の全部又は一部であってもよい。学習データにおいて、文区切り記号のない文字列を入力データとして捉え、文区切り記号のある文字列を教師データとして捉えることができる。

　学習データは、文区切り記号（又は文末記号）のある文字列の中から取り出した一部の文字列である取出文字列から文区切り記号（又は文末記号）を除去した文字列と当該取出文字列との組であってもよい。取出文字列は、例えば、文区切り記号（又は文末記号）のある文字列を単語単位で区切り、ランダムな位置で分割することで得られる一部の文字列であってもよい。

　図３は、学習データの生成方法の一例を示す図である。図３に示すように、文区切り記号のある文字列である元データ「さて、会議を始めます。」から、４つの取出文字列「さて、会議を始めます。」、「さて、」、「会議を」及び「始めます。」が取り出されている。そして、４つの取出文字列それぞれに対して、文区切り記号を除去した文字列「さて会議を始めます」、「さて」、「会議を」及び「始めます」が生成されている。図３において、「さて会議を始めます」と「さて、会議を始めます。」との組、「さて」と「さて、」との組、「会議を」と「会議を」との組、及び、「始めます」と「始めます。」との組が学習データである。

　学習データに含まれる文区切り記号（又は文末記号）のある文字列は、当該文字列を構成する単語ごとに、次に文区切り記号（又は文末記号）が来るか否かを示す系列ラベリングにおけるラベルが付与されていてもよい。その場合、学習データに含まれる文区切り記号（又は文末記号）のない文字列は、単語単位で分割されていてもよい。系列ラベリングにおけるラベルが付与された学習データを用いることで、どの単語の後にどの文区切り記号が入るかを予測する系列ラベリングタスクとして機械学習を行うことができる。

　図４は、系列ラベリングにおけるラベルが付与されている学習データの一例を示す図である。図４において、例えば、文区切り記号のある文字列「さて、会議を始めます。」について、単語「さて」には次に読点が来ることを示すラベル「＜ＣＯＭＭＡ＞」が付与され、単語「会議」及び「を」にはそれぞれ次に文区切り記号が来ないことを示すラベル「＜Ｏ＞」が付与され、単語「始めます」には次に句点が来ることを示すラベル「＜ＰＥＲＩＯＤ＞」が付与されている。

　学習部１１は、文末記号挿入モデルを生成する。より具体的には、学習部１１は、文区切り記号（又は文末記号）のない文字列と文区切り記号（又は文末記号）のある文字列との組である学習データに基づいて（機械）学習を行い、学習済みモデルとして文末記号挿入モデルを生成する。その他に、学習部１１は、上記で説明した各種の学習データに基づいて（機械）学習を行って文末記号挿入モデルを生成してもよい。また、学習部１１は、上記で説明した学習データの生成方法などに基づいて学習データ自体を生成してもよい。

　学習部１１は、生成した文末記号挿入モデルを格納部１０によって格納させる。なお、格納部１０によって格納された文末記号挿入モデルは、学習部１１によって生成されたものではなく、他の装置で同様に生成されたものをネットワークを介して取得したものであってもよい。

　取得部１２は、文字列を順次取得する。取得部１２は、文字列出力装置１とネットワークなどで接続された他の装置から、ネットワークを介して文字列を順次取得してもよい。取得部１２は、文字列出力装置１のユーザがキーボードなどの入力装置１００５（後述）を利用して順次入力した文字列を順次取得してもよい。取得部１２は、文末で終わっていない（可能性のある）文字列、又は、文の区切りが誤っている文区切り誤りの（可能性のある）文字列を順次取得してもよい。

　取得部１２は、音声認識又は文字認識の認識結果である文字列を順次取得してもよい。例えば上述した通り、取得部１２は、音声認識装置又は文字認識装置にてリアルタイムに行われている音声認識又は文字認識の認識結果である文字列を順次取得してもよい。

　取得部１２は、順次取得した文字列を、格納部１０によって格納させてもよいし、判定部１３に出力してもよい。

　判定部１３は、判定対象の文字列である対象文字列について文末が含まれるか否かの判定を繰り返し行う。判定部１３は、初回の判定において、取得部１２によって最初に取得（出力）された文字列を対象文字列として判定を行ってもよい。判定部１３は、初回以降の判定において、前回の判定において対象文字列に文末が含まれないと判定された場合は、当該対象文字列と、取得部１２によって続いて取得（出力）された文字列とを含む新たな対象文字列（当該対象文字列と、取得部１２によって続いて取得（出力）された文字列とが（その順で）結合した文字列）について判定を行ってもよい。判定部１３は、初回以降の判定において、前回の判定において対象文字列に文末が含まれると判定された場合は、当該対象文字列のうち文末より後の文字列と、取得部１２によって続いて取得（出力）された文字列とを含む新たな対象文字列（当該対象文字列のうち文末より後の文字列と、取得部１２によって続いて取得（出力）された文字列とが（その順で）結合した文字列）について判定を行ってもよい。

　判定部１３は、対象文字列の末尾が文末であれば文末が含まれると判定し、対象文字列の末尾が文末でなければ文末が含まれないと判定してもよい。

　判定部１３は、文末記号挿入モデルに、文末記号を除去した対象文字列を入力して得られる文字列に文末記号があるか否かに基づいて、文末が含まれるか否かを判定してもよい。判定部１３は、判定を行った際に対象文字列を、文末記号挿入モデルに文末記号を除去した対象文字列を入力して得られる文字列に置き換えてもよい。

　判定部１３の処理の具体例については後述する。

　判定部１３は、判定結果を格納部１０によって格納させてもよいし、出力部１４に出力してもよい。

　出力部１４は、判定部１３によって対象文字列に文末が含まれると判定された場合、当該対象文字列のうち（文頭から）文末までの文字列を出力する。出力部１４は、ディスプレイなどの出力装置１００６（後述）に出力（表示）してもよいし、翻訳部１５に出力してもよいし、ネットワークを介して他の装置に出力（送信）してもよい。

　翻訳部１５は、出力部１４によって出力された文字列を機械翻訳した結果を出力する。機械翻訳は、既存技術を用いる。翻訳部１５は、ディスプレイなどの出力装置１００６（後述）に出力（表示）してもよいし、ネットワークを介して他の装置に出力（送信）してもよい。

　続いて、図５～図８を参照しながら、文字列出力装置１が実行する各種の文字列出力処理の例を説明する。

　図５は、文字列出力装置１が実行する文字列出力処理の一例（その１）を示すフローチャートである。まず、ユーザが「したがって、こうなります。よって、雨が降ります。」と発話する。次に、音声認識装置が音声認識を順次行った結果、音声認識結果Ａ「したがって。」をまず出力する。次に、取得部１２が、音声認識結果Ａ「したがって。」をまず取得する。音声認識結果Ａ「したがって。」は、取得部１２によって最初に取得された文字列である。次に、判定部１３が、取得された音声認識結果Ａ「したがって。」について文区切り記号を除去し、文区切り記号除去文字列「したがって」を生成する（ステップＳ１ａ）。次に、判定部１３が、文末記号挿入モデルに、生成された文区切り記号除去文字列「したがって」を入力することで、文区切り記号が挿入された文区切り記号挿入文字列「したがって、」を生成する（ステップＳ２ａ）。

　次に、判定部１３が、生成された文区切り記号挿入文字列「したがって、」に文末が含まれるか否かの判定（初回の判定）を行い、文末が含まれないと判定する（ステップＳ３ａ）。次に、判定部１３が、文末が含まれないと判定されたことに伴い、次の音声認識結果を待つ（ステップＳ３ａ）。次に、取得部１２が、音声認識結果Ｂ「こうなりますよって、雨が。」を（音声認識結果Ａ「したがって。」に）続いて取得する。次に、判定部１３が、（判定部１３が初回の判定を行った際に置き換えた、文末記号挿入モデルに文末記号を除去した文区切り記号除去文字列「したがって」を入力して得られる文字列である）文区切り記号挿入文字列「したがって、」と、取得部１２によって続いて取得された音声認識結果Ｂ「こうなりますよって、雨が。」とをその順で結合した結合文字列「したがって、こうなりますよって、雨が。」を生成する（ステップＳ３ａ）。

　次に、判定部１３が、生成された結合文字列「したがって、こうなりますよって、雨が。」について文区切り記号を除去し、文区切り記号除去文字列「したがってこうなりますよって雨が」を生成する（ステップＳ４ａ）。次に、判定部１３が、文末記号挿入モデルに、生成された文区切り記号除去文字列「したがってこうなりますよって雨が」を入力することで、文区切り記号が挿入された文区切り記号挿入文字列「したがって、こうなります。よって、雨が」を生成する（ステップＳ５ａ）。

　次に、判定部１３が、生成された文区切り記号挿入文字列「したがって、こうなります。よって、雨が」に文末が含まれるか否かの判定（２回目の判定）を行い、文末が含まれると判定する。次に、出力部１４が、判定部１３によって文末が含まれると判定されたことに伴い、（判定部１３が２回目の判定を行った際に置き換えた、文末記号挿入モデルに文末記号を除去した文区切り記号除去文字列「したがってこうなりますよって雨が」を入力して得られる文字列である）文区切り記号挿入文字列「したがって、こうなります。よって、雨が」のうち（文頭から）文末までの文字列「したがって、こうなります。」を、音声認識修正結果として出力する（ステップＳ６ａ）。一方、判定部１３が２回目の判定で文末が含まれると判定した際に、判定部１３が、文区切り記号挿入文字列「したがって、こうなります。よって、雨が」のうち文末より後の文字列「よって、雨が」と、取得部１２によって（音声認識結果Ｂ「こうなりますよって、雨が。」に）続いて取得（出力）された文字列とをその順で結合した文字列について引き続き（繰り返し）判定を行う（ステップＳ７ａ）。

　図６は、文字列出力装置１が実行する文字列出力処理の一例（その２）を示すフローチャートである。まず、ユーザが「したがって、こうなります。よって、雨が降ります。」と発話する。次に、音声認識装置が音声認識を順次行った結果、音声認識結果Ｃ「したがって。」をまず出力する。次に、取得部１２が、音声認識結果Ｃ「したがって。」をまず取得する。音声認識結果Ｃ「したがって。」は、取得部１２によって最初に取得された文字列である。次に、判定部１３が、取得された音声認識結果Ｃ「したがって。」について文区切り記号を除去し、文区切り記号除去文字列「したがって」を生成する（ステップＳ１ｂ）。次に、判定部１３が、文末記号挿入モデルに、生成された文区切り記号除去文字列「したがって」を入力することで、文区切り記号が挿入された文区切り記号挿入文字列「したがって、」を生成する（ステップＳ２ｂ）。

　次に、判定部１３が、生成された文区切り記号挿入文字列「したがって、」の末尾が文末であるか否かの判定（初回の判定）を行い、末尾が文末ではない、すなわち文末が含まれないと判定する（ステップＳ３ｂ）。次に、判定部１３が、文末が含まれないと判定されたことに伴い、次の音声認識結果を待つ（ステップＳ３ｂ）。次に、取得部１２が、音声認識結果Ｄ「こうなりますよって、雨が降ります。」を（音声認識結果Ｃ「したがって。」に）続いて取得する。次に、判定部１３が、（判定部１３が初回の判定を行った際に置き換えた、文末記号挿入モデルに文末記号を除去した文区切り記号除去文字列「したがって」を入力して得られる文字列である）文区切り記号挿入文字列「したがって、」と、取得部１２によって続いて取得された音声認識結果Ｄ「こうなりますよって、雨が降ります。」とをその順で結合した結合文字列「したがって、こうなりますよって、雨が降ります。」を生成する（ステップＳ３ｂ）。

　次に、判定部１３が、生成された結合文字列「したがって、こうなりますよって、雨が降ります。」について文区切り記号を除去し、文区切り記号除去文字列「したがってこうなりますよって雨が降ります」を生成する（ステップＳ４ｂ）。次に、判定部１３が、文末記号挿入モデルに、生成された文区切り記号除去文字列「したがってこうなりますよって雨が降ります」を入力することで、文区切り記号が挿入された文区切り記号挿入文字列「したがって、こうなります。よって、雨が降ります。」を生成する（ステップＳ５ｂ）。

　次に、判定部１３が、生成された文区切り記号挿入文字列「したがって、こうなります。よって、雨が降ります。」の末尾が文末であるか否かの判定（２回目の判定）を行い、末尾が文末である、すなわち文末が含まれると判定する。次に、出力部１４が、判定部１３によって文末が含まれると判定されたことに伴い、（判定部１３が２回目の判定を行った際に置き換えた、文末記号挿入モデルに文末記号を除去した文区切り記号除去文字列「したがってこうなりますよって雨が降ります」を入力して得られる文字列である）文区切り記号挿入文字列「したがって、こうなります。よって、雨が降ります。」のうち（文頭から最後の）文末までの文字列「したがって、こうなります。よって、雨が降ります。」を、音声認識修正結果として出力する（ステップＳ６ｂ）。なお、判定部１３が２回目以降の判定で末尾が文末ではない、すなわち文末が含まれないと判定した場合は、判定部１３が、文区切り記号挿入文字列と、取得部１２によって（音声認識結果Ｄ「こうなりますよって、雨が降ります。」に）続いて取得（出力）された文字列とをその順で結合した文字列について引き続き（繰り返し）判定を行う（ステップＳ７ｂ）。

　図７は、文字列出力装置１が実行する文字列出力処理の一例（その３）を示すフローチャートである。まず、ユーザが「したがって、こうなります。よって、雨が降ります。」と発話する。次に、音声認識装置が音声認識を順次行った結果、音声認識結果Ｅ「したがって。」をまず出力する。次に、取得部１２が、音声認識結果Ｅ「したがって。」をまず取得する。音声認識結果Ｅ「したがって。」は、取得部１２によって最初に取得された文字列である。次に、判定部１３が、取得された音声認識結果Ｅ「したがって。」について句読点を除去し、句読点除去文字列「したがって」を生成する（ステップＳ１ｃ）。次に、判定部１３が、句読点挿入モデル（機能的に文末記号挿入モデルと同様）に、生成された句読点除去文字列「したがって」を入力することで、句読点が挿入された句読点挿入文字列「したがって、」を生成する（ステップＳ２ｃ）。

　次に、判定部１３が、生成された句読点挿入文字列「したがって、」の末尾が句点であるか否かの判定（初回の判定）を行い、末尾が句点ではない、すなわち文末が含まれないと判定する（ステップＳ３ｃ）。次に、判定部１３が、文末が含まれないと判定されたことに伴い、次の音声認識結果を待つ（ステップＳ３ｃ）。次に、取得部１２が、音声認識結果Ｆ「こうなりますよって、雨が降ります。」を（音声認識結果Ｅ「したがって。」に）続いて取得する。次に、判定部１３が、（判定部１３が初回の判定を行った際に置き換えた、句読点挿入モデルに句読点を除去した句読点除去文字列「したがって」を入力して得られる文字列である）句読点挿入文字列「したがって、」と、取得部１２によって続いて取得された音声認識結果Ｆ「こうなりますよって、雨が降ります。」とをその順で結合した結合文字列「したがって、こうなりますよって、雨が降ります。」を生成する（ステップＳ３ｃ）。

　次に、判定部１３が、生成された結合文字列「したがって、こうなりますよって、雨が降ります。」について句読点を除去し、句読点除去文字列「したがってこうなりますよって雨が降ります」を生成する（ステップＳ４ｃ）。次に、判定部１３が、句読点挿入モデルに、生成された句読点除去文字列「したがってこうなりますよって雨が降ります」を入力することで、句読点が挿入された句読点挿入文字列「したがって、こうなります。よって、雨が降ります。」を生成する（ステップＳ５ｃ）。

　次に、判定部１３が、生成された句読点挿入文字列「したがって、こうなります。よって、雨が降ります。」の末尾が句点であるか否かの判定（２回目の判定）を行い、末尾が句点である、すなわち文末が含まれると判定する。次に、出力部１４が、判定部１３によって文末が含まれると判定されたことに伴い、（判定部１３が２回目の判定を行った際に置き換えた、句読点挿入モデルに句読点を除去した句読点除去文字列「したがってこうなりますよって雨が降ります」を入力して得られる文字列である）句読点挿入文字列「したがって、こうなります。よって、雨が降ります。」のうち（文頭から最後の）句点までの文字列「したがって、こうなります。よって、雨が降ります。」を、音声認識修正結果として出力する（ステップＳ６ｃ）。次に、翻訳部１５が、出力部１４によって出力された音声認識修正結果を機械翻訳した結果である音声翻訳結果「Therefore,　this　happens.　Therefore,　it　will　rain.」を出力する。

　図８は、図７の音声認識結果に対する従来技術による音声翻訳結果の一例を示す図である。図８に示す通り、音声認識結果Ｅ「したがって。」及び音声認識結果Ｆ「こうなりますよって、雨が降ります。」を、従来技術によりそのまま音声翻訳した場合、音声翻訳結果「Therefore.　This　is　what　will　happen,　and　it　will　rain.」が出力される。

　続いて、実施形態に係る文字列出力装置１の作用効果について説明する。

　文字列出力装置１によれば、文字列を順次取得する取得部１２と、判定対象の文字列である対象文字列について文末が含まれるか否かの判定を繰り返し行う判定部１３であって、初回の判定において、取得部１２によって最初に取得された文字列を対象文字列として判定を行い、初回以降の判定において、前回の判定において対象文字列に文末が含まれないと判定された場合は、当該対象文字列と、取得部１２によって続いて取得された文字列とを含む新たな対象文字列について判定を行う、判定部１３と、判定部１３によって対象文字列に文末が含まれると判定された場合、当該対象文字列のうち文末までの文字列を出力する出力部１４と、を備える。この構成により、順次取得される文字列が含まれる対象文字列について文末が含まれるか否かの判定が行われ、対象文字列に文末が含まれると判定された場合、当該対象文字列のうち文末までの文字列が出力される。すなわち、順次取得した文字列について文末までの文字列を出力することができる。

　また、文字列出力装置１によれば、判定部１３は、対象文字列の末尾が文末であれば文末が含まれると判定し、対象文字列の末尾が文末でなければ文末が含まれないと判定してもよい。この構成により、対象文字列の末尾のみが判定対象となるため、処理が単純化され、処理を高速化することができる。

　また、文字列出力装置１によれば、判定部１３は、初回以降の判定において、前回の判定において対象文字列に文末が含まれると判定された場合は、当該対象文字列のうち文末より後の文字列と、取得部１２によって続いて取得された文字列とを含む新たな対象文字列について判定を行ってもよい。この構成により、取得部１２により順次取得された文字列について、取りこぼすこと無く確実に処理することができる。

　また、文字列出力装置１によれば、判定部１３は、文末記号のない文字列を入力すると文末記号が挿入された文字列を出力する文末記号挿入モデルに、文末記号を除去した対象文字列を入力して得られる文字列に文末記号があるか否かに基づいて、文末が含まれるか否かを判定してもよい。この構成により、文末記号挿入モデルに基づいて修正された、より正確な文字列に対して判定を行うことができるので、より精度が高い処理を行うことができる。

　また、文字列出力装置１によれば、判定部１３は、判定を行った際に対象文字列を、文末記号挿入モデルに文末記号を除去した対象文字列を入力して得られる文字列に置き換えてもよい。この構成により、文末記号挿入モデルに基づいて修正された、より正確な文字列を最終的に出力することができる。

　また、文字列出力装置１によれば、文末記号挿入モデルは、文末記号のない文字列と文末記号のある文字列との組である学習データに基づいて学習された学習済みモデルであってもよい。この構成により、より正確な出力を行う文末記号挿入モデルをより確実に生成することができる。

　また、文字列出力装置１によれば、学習データは、文末記号のある文字列の中から取り出した一部の文字列である取出文字列から文末記号を除去した文字列と当該取出文字列との組であってもよい。この構成により、容易に学習データを生成することができる。

　また、文字列出力装置１によれば、学習データに含まれる文末記号のある文字列は、当該文字列を構成する単語ごとに、次に文末記号が来るか否かを示す系列ラベリングにおけるラベルが付与されていてもよい。この構成により、系列ラベリングタスクとして機械学習を行うことができるため、より精度の高い処理を行うことができる。

　また、文字列出力装置１によれば、取得部１２は、音声認識又は文字認識の認識結果である文字列を順次取得してもよい。この構成により、音声認識又は文字認識の認識結果を対象とすることができる。

　また、文字列出力装置１によれば、出力部１４によって出力された文字列を機械翻訳した結果を出力する翻訳部１５をさらに備えてもよい。この構成により、実世界で応用できる範囲を広げることができる。

　文字列出力装置１は、文区切り位置判定による音声認識結果修正技術である。

　従来の課題について説明する。音声認識では無音区間が一定時間継続すると、そこを文区切り位置と判定し、無音区間までの発話が１つの音声認識結果として出力される。そのため、話し方によって、本来１文となってほしい文の途中で文が区切られることがある。また、文区切りの際に、区切られた文の末尾には句点が挿入されることが多い。このような「文の意味としては１文として処理すべきだが、音声認識の仕組みによって複数文に分かれてしまっており、句読点位置も不適切な音声認識結果」は解釈しづらく、例えば翻訳をする場合には翻訳結果が意図しないものとなる。したがって、音声認識システムにおいて、複数文に分かれてしまった音声認識結果を１文に結合し、かつ句読点を正しく挿入し直す技術が望まれる。また、音声翻訳システムなどにおいては、遅延を発生させずに逐次的に音声認識結果を翻訳して翻訳結果を出力する必要があり、結合が必要な文かどうかの判定のために次にくる音声認識結果を待って利用することは望ましくない（次の音声認識結果を待つ間、現在の音声認識結果及び翻訳結果を出力できないため）。したがって、現在の音声認識結果１文のみを利用し、次に来る音声認識結果と結合すべきか（本来１文とすべきだが複数文に分かれてしまった文かどうか）を判定し、結合が必要な場合のみ次の音声認識結果を待って結合する技術が望まれる。

　例えば、「したがって、こうなります。」という発話を音声翻訳する場合の具体例について説明する。従来技術では、「音声認識の仕組みによって複数文に分かれてしまっており、句読点位置も不適切な音声認識結果」を機械翻訳した結果、意図しない結果が得られてしまう（図９参照）。一方、文字列出力装置１によれば（図１０参照）、音声認識結果Ｇのみを利用し、文区切りではない（次に来る音声認識結果と結合すべき）と判定し、次の音声認識結果との結合および句読点などの文区切り記号を正しく挿入し直す処理を行う。これにより、ユーザの意図した音声認識結果および機械翻訳結果が得られる。音声認識結果Ｇで文区切りであると判定された場合には、次に来る音声認識結果を待つ必要がなく、遅延が発生しない。文区切り判定は、文区切り挿入モデルにより、句読点などの文区切り記号を挿入し直し、末尾が文末記号（句点など）になるかどうかによって判定を行う。

　　従来技術として、音声認識結果が話し終わりかどうか（文区切りかどうか）を自動判定する技術が存在する。この技術では、音声認識結果を句読点単位で分割し、話終わり判定モデルによって判定を行う。この技術では、文区切り位置の判定はできるが、以下の２つの課題がある。
（１）音声認識エンジンが挿入する句読点の位置に依存し、うまく文区切り位置を判定できないことがある。
（２）音声認識エンジンが挿入する句読点の位置に依存し、文結合時に句読点位置が不適切になることがある。

　上記課題（１）について説明する（図１１参照）。音声認識結果の句読点に誤りがあり、１音声認識結果中に２つの文が含まれる場合、正しい文区切り位置を推測できない。例えば、図１１の通り、「したがって、こうなります。」及び「よって、雨が降ります。」の２文が含まれることを判定できない。「こうなります」の後ろで区切って判定できない。すなわち、音声認識エンジンが挿入する句読点位置に依存している。

　上記課題（２）について説明する（図１２参照）。音声認識結果の句読点に誤りがあると結合時に句読点位置が適切な位置ではない文となる。図１２の通り、結合後の句読点位置が不適切である。すなわち、音声認識エンジンが挿入する句読点位置に依存している。

　文字列出力装置１によれば、音声認識エンジンが挿入する句読点を全て削除し、自作のモデルにより句読点を挿入し直して文区切り判定をするため、音声認識エンジンが挿入する句読点の位置に依存せずに処理することができ、上記の課題を解決することができる。

　　従来技術として、句読点位置を予測する技術が存在する。この技術では、句読点位置の予測ができるが、以下の課題がある。
（１）対象が音声認識結果のような順次入力される誤りの含まれることが多いデータではない（途中切れとなっている学習データを利用していない）。
（２）句読点のみの位置を予測する技術であり、その他の記号に対応していない（「！」「？」などへの対応）。
（３）句読点処理のみであり、文区切り判定や、文の結合などは行わない。

　文字列出力装置１によれば、途中切れとなっている文を学習データとして利用するため、途中切れとなっている文の句読点位置の予測に強い。また、句読点に加え、その他の文区切り記号も挿入することが可能である（「！」「？」など）。また、句読点挿入を応用し、文区切りの判定や文の結合を行う技術である。

　　従来技術として、句読点位置予測技術が存在する。この技術では、２文間の句点位置の正しさを判定することができるが、以下の課題がある。
（１）２文を入力して２文の間に句点が必要かどうかを判定する技術であり、次の入力を待つ必要があるため遅延が発生する。
（２）２文間の句点以外の記号や位置に対応していない。
（３）句点処理のみであり、文区切り判定や、文の結合などは行わない。

　文字列出力装置１によれば、１文のみで判定が可能であり、遅延が発生しない。また、句点に加え、その他の文区切り記号も挿入することが可能である（「、」「！」「？」など）。また、句読点挿入を応用し、文区切りの判定や文の結合を行う技術である。

　以上の通り、文字列出力装置１には以下の利点がある。
（１）音声認識結果１文のみを利用して文区切り判定（結合が必要かどうかの判定）を行うことが可能である。すなわち、次の音声認識結果を待つための遅延が発生しない。
（２）音声認識エンジンが挿入する句読点などの文区切り記号に依存せず、文区切り位置の判定が可能である。すなわち、文区切り判定の精度が高い。
（３）音声認識エンジンが挿入する句読点などの文区切り記号に依存せず、文結合後の文に対して、文区切り記号を適切な位置に挿入し直すことが可能である。すなわち、文結合後の文をより自然な文に修正することができる。
（４）句読点のみではなく、「？」「！」といった文区切り記号を挿入することが可能である。すなわち、文区切り判定の精度が高い、かつ、文結合後の文をより自然な文に修正することができる。

　文字列出力装置１は以下の構成としてもよい。

　［項番１］
　音声認識結果に対して、全ての文区切り記号（「、」「。」「！」「？」など）を取り除き、文区切り記号のある文とそれを取り除いた文をペアとする学習データの機械学習により生成された文区切り記号挿入モデルを用いて文区切り記号を挿入するステップと、
　前記文区切り記号挿入音声認識結果の末尾が文末記号（「。」「！」「？」）でなければ文末ではないと判定し、次の音声認識結果と結合するステップと、
　前記結合済み音声認識結果に対して再度文区切り記号を全て取り除き、文区切り記号挿入モデルを用いて文区切り記号を挿入するステップと、
　前記文区切り記号挿入音声認識結果の末尾が文末記号となるまでこれを繰り返すステップと、
　末尾が文末記号となった文を音声認識修正結果とするステップと、
　を備えることを特徴とする音声認識結果修正方法。

　［項番２］
　前記の文末判定のステップにおいて、文末が文末記号ではないが、文中に文末記号を含む場合、文頭から文末記号までを音声認識修正結果として出力し、文中の文末記号から文末までを次音声認識結果と結合することを特徴とする、
　項番１に記載の音声認識結果修正方法。

　［項番３］
　前記の機械学習による文区切り記号挿入モデルの生成のステップにおいて、文区切り記号のある文を元データとし、「文を単語単位で区切り、ランダムな位置で分割する処理（音声認識の不適切な文区切りに対応するため）」と「文区切り記号を削除する処理」を行い、ペアとなる文区切り記号除去文を生成することを特徴とする、
　項番１に記載の音声認識結果修正方法。

　［項番４］
　前記の機械学習による文区切り記号挿入モデルの生成のステップにおいて、単語単位で分割された「文区切り記号除去文」に対して、「文区切り記号のある文」の文区切り記号位置を教師データとして、どの単語の後にどの文区切り記号が入るかを予測する系列ラベリングタスクとして機械学習を行うことを特徴とする、
　項番１に記載の音声認識結果修正方法。

　［項番５］
　前記音声認識結果修正方法を応用し、会議や電話等を音声認識し、その音声認識結果を適切な文区切り及び記号となるよう修正した結果を機械翻訳し、音声翻訳結果とすることを特徴とする、
　項番１に記載の音声翻訳方法。

　実施形態において、言語は日本語を例に記載しているが、日本語以外の言語にも使える技術である。実施形態において、「音声認識」を対象として記載しているが、音声認識に限った技術ではなく、「順次入力される、文区切り誤りの含まれるテキスト」に対して有効な技術である。

　なお、上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック（構成部）は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した１つの装置を用いて実現されてもよいし、物理的又は論理的に分離した２つ以上の装置を直接的又は間接的に（例えば、有線、無線などを用いて）接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記１つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。

　機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知（broadcasting）、通知（notifying）、通信（communicating）、転送（forwarding）、構成（configuring）、再構成（reconfiguring）、割り当て（allocating、mapping）、割り振り（assigning）などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック（構成部）は、送信部（transmitting　unit）や送信機（transmitter）と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。

　例えば、本開示の一実施の形態における文字列出力装置１などは、本開示の文字列出力方法の処理を行うコンピュータとして機能してもよい。図１３は、本開示の一実施の形態に係る文字列出力装置１のハードウェア構成の一例を示す図である。上述の文字列出力装置１は、物理的には、プロセッサ１００１、メモリ１００２、ストレージ１００３、通信装置１００４、入力装置１００５、出力装置１００６、バス１００７などを含むコンピュータ装置として構成されてもよい。

　なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。文字列出力装置１のハードウェア構成は、図に示した各装置を１つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。

　文字列出力装置１における各機能は、プロセッサ１００１、メモリ１００２などのハードウェア上に所定のソフトウェア（プログラム）を読み込ませることによって、プロセッサ１００１が演算を行い、通信装置１００４による通信を制御したり、メモリ１００２及びストレージ１００３におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。

　プロセッサ１００１は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ１００１は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置（ＣＰＵ：Central　Processing　Unit）によって構成されてもよい。例えば、上述の学習部１１、取得部１２、判定部１３、出力部１４及び翻訳部１５などは、プロセッサ１００１によって実現されてもよい。

　また、プロセッサ１００１は、プログラム（プログラムコード）、ソフトウェアモジュール、データなどを、ストレージ１００３及び通信装置１００４の少なくとも一方からメモリ１００２に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、学習部１１、取得部１２、判定部１３、出力部１４及び翻訳部１５は、メモリ１００２に格納され、プロセッサ１００１において動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、１つのプロセッサ１００１によって実行される旨を説明してきたが、２以上のプロセッサ１００１により同時又は逐次に実行されてもよい。プロセッサ１００１は、１以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。

　メモリ１００２は、コンピュータ読み取り可能な記録媒体であり、例えば、ＲＯＭ（Read　Only　Memory）、ＥＰＲＯＭ（Erasable　Programmable　ＲＯＭ）、ＥＥＰＲＯＭ（Electrically　Erasable　Programmable　ROM）、ＲＡＭ（Random　Access　Memory）などの少なくとも１つによって構成されてもよい。メモリ１００２は、レジスタ、キャッシュ、メインメモリ（主記憶装置）などと呼ばれてもよい。メモリ１００２は、本開示の一実施の形態に係る無線通信方法を実施するために実行可能なプログラム（プログラムコード）、ソフトウェアモジュールなどを保存することができる。

　ストレージ１００３は、コンピュータ読み取り可能な記録媒体であり、例えば、ＣＤ－ＲＯＭ（Compact　Disc　ROM）などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク（例えば、コンパクトディスク、デジタル多用途ディスク、Ｂｌｕ－ｒａｙ（登録商標）ディスク）、スマートカード、フラッシュメモリ（例えば、カード、スティック、キードライブ）、フロッピー（登録商標）ディスク、磁気ストリップなどの少なくとも１つによって構成されてもよい。ストレージ１００３は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ１００２及びストレージ１００３の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。

　通信装置１００４は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア（送受信デバイス）であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。通信装置１００４は、例えば周波数分割複信（ＦＤＤ：Frequency　Division　Duplex）及び時分割複信（ＴＤＤ：Time　Division　Duplex）の少なくとも一方を実現するために、高周波スイッチ、デュプレクサ、フィルタ、周波数シンセサイザなどを含んで構成されてもよい。例えば、上述の学習部１１、取得部１２、判定部１３、出力部１４及び翻訳部１５などは、通信装置１００４によって実現されてもよい。

　入力装置１００５は、外部からの入力を受け付ける入力デバイス（例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど）である。出力装置１００６は、外部への出力を実施する出力デバイス（例えば、ディスプレイ、スピーカー、ＬＥＤランプなど）である。なお、入力装置１００５及び出力装置１００６は、一体となった構成（例えば、タッチパネル）であってもよい。

　また、プロセッサ１００１、メモリ１００２などの各装置は、情報を通信するためのバス１００７によって接続される。バス１００７は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。

　また、文字列出力装置１は、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ：Digital　Signal　Processor）、ＡＳＩＣ（Application　Specific　Integrated　Circuit）、ＰＬＤ（Programmable　Logic　Device）、ＦＰＧＡ（Field　Programmable　Gate　Array）などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ１００１は、これらのハードウェアの少なくとも１つを用いて実装されてもよい。

　情報の通知は、本開示において説明した態様／実施形態に限られず、他の方法を用いて行われてもよい。

　本開示において説明した各態様／実施形態は、ＬＴＥ（Long　Term　Evolution）、ＬＴＥ－Ａ（LTE-Advanced）、ＳＵＰＥＲ　３Ｇ、ＩＭＴ－Ａｄｖａｎｃｅｄ、４Ｇ（4th　generation　mobile　communication　system）、５Ｇ（5th　generation　mobile　communication　system）、ＦＲＡ（Future　Radio　Access）、ＮＲ（new　Radio）、Ｗ－ＣＤＭＡ（登録商標）、ＧＳＭ（登録商標）、ＣＤＭＡ２０００、ＵＭＢ（Ultra　Mobile　Broadband）、ＩＥＥＥ　８０２．１１（Ｗｉ－Ｆｉ（登録商標））、ＩＥＥＥ　８０２．１６（ＷｉＭＡＸ（登録商標））、ＩＥＥＥ　８０２．２０、ＵＷＢ（Ultra-WideBand）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、その他の適切なシステムを利用するシステム及びこれらに基づいて拡張された次世代システムの少なくとも一つに適用されてもよい。また、複数のシステムが組み合わされて（例えば、ＬＴＥ及びＬＴＥ－Ａの少なくとも一方と５Ｇとの組み合わせ等）適用されてもよい。

　本開示において説明した各態様／実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。

　入出力された情報等は特定の場所（例えば、メモリ）に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。

　判定は、１ビットで表される値（０か１か）によって行われてもよいし、真偽値（Boolean：true又はfalse）によって行われてもよいし、数値の比較（例えば、所定の値との比較）によって行われてもよい。

　本開示において説明した各態様／実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知（例えば、「Ｘであること」の通知）は、明示的に行うものに限られず、暗黙的（例えば、当該所定の情報の通知を行わない）ことによって行われてもよい。

　以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。

　ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。

　また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術（同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ：Digital　Subscriber　Line）など）及び無線技術（赤外線、マイクロ波など）の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。

　本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。

　なお、本開示において説明した用語及び本開示の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。

　本開示において使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。

　また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。

　上述したパラメータに使用する名称はいかなる点においても限定的な名称ではない。さらに、これらのパラメータを使用する数式等は、本開示で明示的に開示したものと異なる場合もある。

　本開示で使用する「判断（determining）」、「決定（determining）」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定（judging）、計算（calculating）、算出（computing）、処理（processing）、導出（deriving）、調査（investigating）、探索（looking　up、search、inquiry）（例えば、テーブル、データベース又は別のデータ構造での探索）、確認（ascertaining）した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信（receiving）（例えば、情報を受信すること）、送信（transmitting）（例えば、情報を送信すること）、入力（input）、出力（output）、アクセス（accessing）（例えば、メモリ中のデータにアクセスすること）した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決（resolving）、選択（selecting）、選定（choosing）、確立（establishing）、比較（comparing）などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断（決定）」は、「想定する（assuming）」、「期待する（expecting）」、「みなす（considering）」などで読み替えられてもよい。

　「接続された（connected）」、「結合された（coupled）」という用語、又はこれらのあらゆる変形は、２又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された２つの要素間に１又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、２つの要素は、１又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光（可視及び不可視の両方）領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。

　本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。

　本開示において使用する「第１の」、「第２の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定しない。これらの呼称は、２つ以上の要素間を区別する便利な方法として本開示において使用され得る。したがって、第１及び第２の要素への参照は、２つの要素のみが採用され得ること、又は何らかの形で第１の要素が第２の要素に先行しなければならないことを意味しない。

　上記の各装置の構成における「手段」を、「部」、「回路」、「デバイス」等に置き換えてもよい。

　本開示において、「含む（include）」、「含んでいる（including）」及びそれらの変形が使用されている場合、これらの用語は、用語「備える（comprising）」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は（or）」は、排他的論理和ではないことが意図される。

　本開示において、例えば、英語でのa、an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。

　本開示において、「ＡとＢが異なる」という用語は、「ＡとＢが互いに異なる」ことを意味してもよい。なお、当該用語は、「ＡとＢがそれぞれＣと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。

　１…文字列出力装置、１０…格納部、１１…学習部、１２…取得部、１３…判定部、１４…出力部、１５…翻訳部、１００１…プロセッサ、１００２…メモリ、１００３…ストレージ、１００４…通信装置、１００５…入力装置、１００６…出力装置、１００７…バス。

Claims

　文字列を順次取得する取得部と、
　判定対象の文字列である対象文字列について文末が含まれるか否かの判定を繰り返し行う判定部であって、
　　初回の判定において、前記取得部によって最初に取得された文字列を対象文字列として判定を行い、
　　初回以降の判定において、前回の判定において対象文字列に文末が含まれないと判定された場合は、当該対象文字列と、前記取得部によって続いて取得された文字列とを含む新たな対象文字列について判定を行う、判定部と、
　前記判定部によって対象文字列に文末が含まれると判定された場合、当該対象文字列のうち文末までの文字列を出力する出力部と、
　を備える文字列出力装置。
　前記判定部は、対象文字列の末尾が文末であれば文末が含まれると判定し、対象文字列の末尾が文末でなければ文末が含まれないと判定する、
　請求項１に記載の文字列出力装置。
　前記判定部は、初回以降の判定において、前回の判定において対象文字列に文末が含まれると判定された場合は、当該対象文字列のうち文末より後の文字列と、前記取得部によって続いて取得された文字列とを含む新たな対象文字列について判定を行う、
　請求項１に記載の文字列出力装置。
　前記判定部は、文末記号のない文字列を入力すると文末記号が挿入された文字列を出力する文末記号挿入モデルに、文末記号を除去した対象文字列を入力して得られる文字列に文末記号があるか否かに基づいて、文末が含まれるか否かを判定する、
　請求項１～３の何れか一項に記載の文字列出力装置。
　前記判定部は、判定を行った際に対象文字列を、文末記号挿入モデルに文末記号を除去した対象文字列を入力して得られる文字列に置き換える、
　請求項４に記載の文字列出力装置。
　文末記号挿入モデルは、文末記号のない文字列と文末記号のある文字列との組である学習データに基づいて学習された学習済みモデルである、
　請求項４又は５に記載の文字列出力装置。
　学習データは、文末記号のある文字列の中から取り出した一部の文字列である取出文字列から文末記号を除去した文字列と当該取出文字列との組である、
　請求項６に記載の文字列出力装置。
　学習データに含まれる文末記号のある文字列は、当該文字列を構成する単語ごとに、次に文末記号が来るか否かを示す系列ラベリングにおけるラベルが付与されている、
　請求項６又は７に記載の文字列出力装置。
　前記取得部は、音声認識又は文字認識の認識結果である文字列を順次取得する、
　請求項１～８の何れか一項に記載の文字列出力装置。
　前記出力部によって出力された文字列を機械翻訳した結果を出力する翻訳部をさらに備える、
　請求項１～９の何れか一項に記載の文字列出力装置。