以下、添付図面を参照して、本開示の例示的実施形態を説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
図1は、本開示の一実施形態に係る情報提供装置の概略構成を示す図である。図1に示す情報提供装置1は、ユーザUに対して音声で情報を提供する装置である。また、情報提供装置1は、ユーザUからの発話に対応して音声により応答する機能も有する。すなわち、情報提供装置1は、ユーザUとの対話が可能な対話装置として機能する。情報提供装置1は、対話モジュール10と、発話管理モジュール20と、応答情報生成モジュール30と、発話情報生成モジュール40A,40Bと、を含んで構成される。
本実施形態で示す情報提供装置1は、リアルタイムで進行する特定のコンテンツについてユーザUが観賞しているまたは興味を示している場合に、当該コンテンツに対応した情報をユーザUに対して提供することを特徴とする。リアルタイムで進行する特定のコンテンツとは、例えば、スポーツ、競馬、株価変動等が挙げられる。また、気象情報や一般的なニュースなどの一般的な情報、または、日常生活自体を「コンテンツ」として取り扱ってもよい。情報提供装置1は、これらのコンテンツをユーザUが観賞している場合に、コンテンツの進行に応じてユーザUに対して情報を提供する。以下、ユーザUが観賞しているまたは興味を示しているコンテンツを、「対象コンテンツ」という場合がある。情報提供装置1は、対象コンテンツに関する情報をユーザUに対して提供する。
上記の場合のユーザUに対する情報提供とは、ユーザUからの質問に対して応答することではなく、情報提供装置1からユーザUに対して自発的に情報を提供することを指す。なお、情報提供装置1は、ユーザUからの質問に対して応答する構成も有している。したがって、情報提供装置1は、ユーザUからの質問に対して応答すると共に、自発的にユーザUに対して情報提供を行う装置である。
情報提供装置1の対話モジュール10は、ユーザUとの間の音声による情報の送受信のインタフェースとなるモジュールであり、ユーザUの発する音声を受信する機能と、ユーザUに対して音声を発する機能とを有する。すなわち、対話モジュール10は、ユーザUに対して発話により音声情報を提供する出力部としても機能する。
ユーザUの発する音声を受信する機能としては、例えば、マイクが挙げられる。また、ユーザUに対して音声を発する機能としては、例えば、スピーカーが挙げられる。また、対話モジュール10では、受信したユーザUの音声の音声認識処理等を行ない、テキストデータ化する機能を有していてもよい。テキストデータ化されたユーザUからの音声情報は、後述の発話管理モジュール20へ送られる。さらに、対話モジュール10では、ユーザUへの発話のために、後述の発話管理モジュール20から提供されるテキストデータの音声合成処理を行う機能を有していてもよい。対話モジュール10が上記の音声認識処理および音声合成処理を行う場合、対話モジュール10と発話管理モジュール20との間での情報(ユーザUに対して提供する情報またはユーザUから取得した情報)の送受信には、テキストデータが用いられる。
発話管理モジュール20は、ユーザUに対して発話する音声情報の管理を行う。詳細は後述するが、対象コンテンツの進行状況に応じて、ユーザUに対して、対象コンテンツに関するどのような情報をどのようなタイミングで提供するか、を管理する。また、ユーザUからの問い合わせがあった場合には、ユーザUの問い合わせに対して適切に応答する機能も有する。発話管理モジュール20では、情報提供装置1から問い合わせに対する応答も含む、ユーザUに対する情報提供に係る管理を行う機能を有する。なお、発話管理モジュール20は、応答情報生成モジュール30で生成された応答文、発話情報生成モジュール40A,40Bで生成された発話文を蓄積し、適切なタイミングに、対話モジュール10を介してユーザUに対して出力することに係る制御を行う。この制御の詳細は後述する。
応答情報生成モジュール30は、ユーザUから問い合わせがあった内容に対する応答文を作成するモジュールである。応答情報生成モジュール30では、発話管理モジュール20から送られるユーザUからの問い合わせに対する応答文を生成する。なお、応答文の生成の際に、外部装置等との間で通信等を行ない必要な情報を取得する構成であってもよい。応答情報生成モジュール30において生成された応答文は、発話管理モジュール20へ送られて、ユーザUへの出力が行われる。
発話情報生成モジュール40A,40Bは、いずれも、ユーザUに対して自発的に発話する発話文を生成する機能を有する。情報提供装置1では、2つの発話情報生成モジュール40A,40Bにより構成されている例を示すが、発話情報生成モジュールの数は1つでも3つ以上の複数でもよい。情報提供装置1では、発話情報生成モジュール40Aは、対象コンテンツの進行に直結した情報を含む発話文を生成するモジュールであり、発話情報生成モジュール40Bは、対象コンテンツの進行に直接は関係しないがコンテンツに関係する情報に係る発話文を生成するモジュールである、とする。ただし、複数の発話情報生成モジュールを有している場合、上記のような取り扱いの区分けを行っていても行っていなくてもよい。
発話情報生成モジュール40Aは、対象コンテンツの進行に係る情報に係る発話文を生成する。発話情報生成モジュール40Aは、発話文を生成するために、対象コンテンツの進行に係る情報を提供する外部装置である、コンテンツ進行情報提供装置50からの情報を取得する。コンテンツ進行情報提供装置50は、対象コンテンツの進行状況を示す情報を文章とは異なるデータ形式で提供する装置である。対象コンテンツの進行状況を示す情報とは、例えば、対象コンテンツがスポーツの場合にはプレイの詳細内容を示す情報が挙げられる。また、対象コンテンツが株価変動の場合には、価格変動が大きい株に係る情報が挙げられる。コンテンツ進行情報提供装置50からこれらの情報を取得すると、発話情報生成モジュール40Aは、これらの情報を説明するための文章(自然文)を生成する。
発話情報生成モジュール40Bは、対象コンテンツに関連する情報に係る発話文を生成する。発話情報生成モジュール40Bは、発話文を生成するために、対象コンテンツの進行に係る情報を提供する外部装置である、コンテンツ進行情報提供装置50からの情報を取得する。また、コンテンツ進行情報提供装置50とは異なる装置である外部DB60(データベース)等から情報を取得してもよい。なお、対象コンテンツに関連する情報とは、例えば、対象コンテンツがスポーツの場合には特定のプレイを行ったプレイヤーに係る情報、または、特定のプレイを説明する情報等が挙げられる。また、対象コンテンツが株価変動の場合には、価格変動が大きい株と同じ業種の株価に関する情報、または、関連企業の情報等が挙げられる。コンテンツ進行情報提供装置50において出力される対象コンテンツの進行に係る情報、および、外部DB60において出力される情報等を組み合わせて、発話情報生成モジュール40Bは、これらの情報を説明するための文章を生成する。
発話情報生成モジュール40A,40Bにおいて生成された応答文は、発話管理モジュール20へ送られて、ユーザUへの出力が行われる。
次に、発話管理モジュール20について、図2を参照しながらさらに説明する。図2に示すように、発話管理モジュール20は、発話待機情報保持部21、発話判定部22、および、スコア付与部23を有する。スコア付与部23は、内容スコア算出部24、経過時間スコア算出部25、および、状況スコア算出部26を有する。
発話待機情報保持部21は、発話情報生成モジュール40A,40Bから送られる発話文を保持する機能を有する。すなわち、ユーザUに対して発話により音声情報を提供する候補となる情報である発話文を保持する機能を有する。発話判定部22は、ユーザUに対して発話により音声情報を提供するか否かを判定すると共に、発話する場合には、発話待機情報保持部21において保持される発話文から、ユーザUに対して音声情報として出力する(発話する)発話文を選択する機能を有する。スコア付与部23は、発話待機情報保持部21において保持される発話文それぞれに対して、スコアを付与する。スコアとは、発話の優先度に関係する数値である。付与されているスコアが高い発話文ほど、ユーザUに対して音声情報として提供することが好ましい情報であるといえる。換言すると、スコアは、ユーザUの周辺環境等を考慮して設定される値であり、コンテキストを考慮した数値であるともいえる。
発話情報生成モジュール40A,40Bでは、対象コンテンツの進行状況に応じて、種々の発話文が生成される。ただし、全ての発話文を情報提供装置1がユーザUに対して出力すると、情報提供装置1から出力される音声情報が過多となる可能性がある。また、ユーザUからの問い合わせがあった場合には、問い合わせへの応答を優先することが望まれる。したがって、情報提供装置1から出力する音声情報のうち、発話文の量は適宜調整を図る必要がある。
また、情報提供装置1から出力する音声情報の内容も状況(特にコンテンツの進行状況)に応じて適宜変化させることが望まれる。例えば、対象コンテンツが緊迫した状況では、ユーザUは、対象コンテンツの関連情報よりも対象コンテンツの進行自体を説明する情報を知りたいことも考えられる。一方、対象コンテンツの変化が乏しい状況では、対象コンテンツの進行を説明する情報が少なくなるので、対象コンテンツの関連情報を提供することでユーザUの興味を引くことも考えられる。
上記の点を鑑み、情報提供装置1では、発話情報生成モジュール40A,40Bで生成される発話文を全て発話するのではなく、対象コンテンツの進行状況等を考慮して発話文を選択して出力する。この管理を行うのが発話管理モジュール20となる。
発話管理モジュール20の発話待機情報保持部21では、発話情報生成モジュール40A,40Bにおいて生成された発話文(発話の候補となる発話文)を蓄積する。そして、発話情報生成モジュール40A,40Bに蓄積された発話文のうち、どの発話文を音声情報として出力するかを発話判定部22が判定する。この判定に用いられるのがスコア付与部23において算出して付与されるスコアである。発話判定部22は、発話待機情報保持部21において保持される発話文毎に、スコア付与部23により付与されたスコアを参照し、スコアが最上位であり(最も高く)、かつ、所定の閾値以上である発話文を音声情報として出力する発話文として選択する。
スコア付与部23では、主に3つの要素に基づいてスコアを算出し、これらを合算して発話文毎のスコアを算出する。3つの要素は、「内容スコア」、「経過時間スコア」、および、「状況スコア」であり、これらの各要素に係るスコアを、内容スコア算出部24、経過時間スコア算出部25、および、状況スコア算出部26において算出する。
「内容スコア」とは、発話文に含まれる内容に基づいて算出される数値である。発話文には、複数の単語が含まれている。内容スコアは、これらの複数の単語に基づいて付与されるスコアである。内容スコアの付与の仕方は特に限定されないが、簡単な方法としては、対象コンテンツに関連する単語について単語毎に予め付与するスコアを決めておき、発話文に含まれる単語毎に対応するスコアを加算していく方法が挙げられる。また、ディープラーニング等の機械学習に係る手法を利用して、発話文毎に特徴量を算出し、この特徴量をスコアとする方法を用いてもよい。例えば、単語の集合により構成されている文と、この文の重要度に対応付けられたスコア(0~1の確率として示された数値)と、の組を複数準備して、教師データを作成し、この教師データを利用して、CNN(Convolution Neural Network)等のディープラーニング手法を用いて、対象となる発話文のスコアを算出する構成としてもよい。スコアの算出に用いるディープラーニングの手法または機械学習の手法は特に限定されない。
「経過時間スコア」とは、情報提供装置1が前回ユーザUに対して音声情報を出力してからの経過時間に対応する数値である。情報提供装置1では、ユーザUに対して前回音声情報を出力した時点からの時間の長さに応じてスコアを変化させる。経過時間に応じて付与するスコアについては、例えば、経過時間スコア算出部25において、予め経過時間に基づくスコアの算出式等を準備しておき、算出式に基づいて自動的に付与する数値を決定する方法が挙げられる。ただし、この方法には限定されない。
「状況スコア」とは、対象コンテンツの進行状況に基づいて決定される、対象コンテンツの状況に応じた情報提供の必要性を示す数値である。例えば、対象コンテンツが緊迫した状況では、ユーザUは、対象コンテンツに係る音声情報に対する要求が高くなる可能性があるため、スコアを高く設定すると考えることができる。また、対象コンテンツが緊迫していない状況では、対象コンテンツに係る関連情報についてもユーザUが興味を示す可能性があるため、関連情報に対してスコアを高く設定するという考え方もできる。このように、状況スコアとは、対象コンテンツの進行状況に応じて設定されるスコアである。
なお、状況スコアは、上述の通り対象コンテンツの進行状況に基づいて設定される。したがって、状況スコア算出部26は、発話情報生成モジュール40A,40Bが取得するコンテンツ進行情報提供装置50からのコンテンツの進行に係る情報を利用して、状況スコアを算出する構成としてもよい。このような構成の場合、状況スコア算出部26では、状況スコアを算出する方法として、コンテンツ進行情報提供装置50から提供されるコンテンツの進行に係る情報に含まれて、対象コンテンツの進行状況との関連性が高い単語に対して予め特定のスコアを決めておく方法を用いることができる。例えば、対象コンテンツがサッカーである場合には、大きなイベントとなると考えられる「ゴール」に対してスコア1.0を付与し、サッカーでは頻発しがちな「パス」に対してはスコア0.1を付与する、という手法が考えられる。また、サッカーの場合には、プレイ中のボールの位置等をスコアに変換して、利用するという手法が考えられる。また、対象コンテンツが株価変動である場合には、例えば、株価の「暴落」または「ストップ高」などが、スコアを付与する対象となる単語になり得る。
なお、対象コンテンツが日常生活全般のような一般的な状況である場合にも、状況スコアの付与はできる。具体的には、情報提供装置1からの音声情報の提供をユーザUが望むと想定される事象(例えば、天候の変化を示す情報)を示す単語には、予め高い値のスコアを設定し、音声情報の提供をユーザUが望まないと想定される事象(例えば、ユーザUの外出予定を示す情報など)を示す単語には、予め低い値のスコアを設定しておくことができる。このような構成とすることで、対象コンテンツがスポーツなどの特定のカテゴリのものに限定されない場合でも、状況スコアの付与が可能となる。
状況スコア算出部26では、例えば、発話文の生成のタイミングで、コンテンツ進行情報提供装置50から提供されるコンテンツの進行に係る情報のうち、直近の(または直近から所定の数の)情報から、スコアが決められた特定の単語を取り出し、そのスコアの合計を算出して、状況スコアとする方法を用いてもよい。このように、状況スコアの付与の方法は特に限定されず、種々の方法を用いることができる。また、状況スコアの付与についても、内容スコアと同様に、機械学習等の手法を用いてもよい。
なお、発話情報生成モジュール40A,40Bが取得する情報とは別の情報に基づいて状況スコアを算出する構成としてもよい。
各部で算出されるスコアについては、0以上の数値で表現してもよいし、確率(0~1)で表現してもよい。
上記のように、内容スコア算出部24、経過時間スコア算出部25、および、状況スコア算出部26では、一の発話文に対して互いに異なる観点からスコアを算出する。そして、スコア付与部23では、各部で算出されたスコアを合算することで、一の発話文に対するスコアを算出する。スコアの合算方法は特に限定されず、例えば、単純な加算としてもよい。また、内容スコア、経過時間スコア、および状況スコアが、それぞれ確率(0~1)で算出される場合には、アンダーフローを避けるために、各スコアの対数の合計を求めて、一の発話文に対するスコアとしてもよい。
発話情報生成モジュール40A,40Bにおいて生成されて、発話待機情報保持部21において保持される発話文毎に、スコア付与部23においてスコアが算出されて付与される。この結果、図3に示すように、発話待機情報保持部21では、情報提供装置1からの発話を待機している発話文(キュー)に対してそれぞれスコアが付与されて保持されている。図3に示す例では、「A選手がシュートしました。」という発話文に、スコア0.8が対応付けられている。また、「A選手は、○○出身です。」という発話文には、スコア0.7が対応付けられている。このように、発話待機情報保持部21では、発話情報生成モジュール40A,40Bにおいてそれぞれ生成された発話文について、個別にスコアが付与された状態で保持されている。
なお、発話待機情報保持部21で保持されている発話文に対応付けられているスコアは、適宜更新されてもよい。例えば、対象コンテンツの進行状況によっては、各発話文に付与されているスコアが適切ではなくなる場合がある。また、発話待機情報保持部21で保持されている発話文を用いた発話、あるいは、ユーザUからの問い合わせに対して応答のために、情報提供装置1から音声出力を行った場合には、経過時間がリセットされる。そのため、発話待機情報保持部21で保持されるスコアは、適宜(例えば、所定のタイミングで)スコア付与部23により更新されてもよい。
発話判定部22では、発話待機情報保持部21を定期的(例えば、数百m秒おき)に参照する。そして、発話判定部22は、発話待機情報保持部21に保持されている発話文のうち最もスコアが高い発話文を参照し、当該発話文に対して付与されているスコアが、予め定めた閾値以上である場合には、当該発話文に基づいてユーザUに対して発話すると判定し、当該発話文を選択する。すなわち、発話判定部22は、ユーザUに対して音声情報として提供する発話文を選択する発話情報選択部としての機能を有する。
なお、発話判定部22は、発話待機情報保持部21に保持されている発話文のうち最もスコアが高い発話文に対して付与されているスコアが閾値よりも小さい場合には発話が不要であると判断し、次の機会まで発話を行わない構成としてもよい。
発話判定部22により発話すると判定された発話文は、発話待機情報保持部21から消去される。これにより、同じ発話文が再度発話されることを防ぐことができる。また、発話待機情報保持部21に保持されてから所定時間経過した発話文も、発話可能性が低くなったとして発話待機情報保持部21から消去することができる。このような構成とすることで、発話待機情報保持部21に保持される発話文のうち、今後発話する予定がない(見込みが低い)発話文が長時間保持されて、データ量が増大することを防ぐことができる。
なお、発話判定部22が発話待機情報保持部21を参照するタイミングは、ユーザUからの発話(問い合わせなど)の有無等に応じて適宜変更してもよい。例えば、ユーザUからの発話あった場合には、情報提供装置1ではユーザUからの発話に応答することが優先され、情報提供装置1からの自発的な発話は省略される。したがって、このような状態では、発話判定部22は、発話待機情報保持部21の参照自体を省略してもよい。情報提供装置1において、発話管理モジュール20は、ユーザUからの発話に対する応答についても管理する。したがって、発話管理モジュール20では、発話の優先度等に基づいて、ユーザUからの発話に対する応答、および、自発的な音声情報の提供を両立できるように、発話する情報の管理を行う。
次に、図4を参照しながら、情報提供装置1における情報提供方法について説明する。図4では、情報提供装置1側からの自発的な音声情報野提供に係る手順を説明している。なお、図4では、ユーザUからの発話に対する応答に係る手順についての説明は行っていない。
図4に示すように、情報提供装置1の発話情報生成モジュール40A,40Bでは、コンテンツ進行情報提供装置50から対象コンテンツの進行に係る情報を取得する(S01)。発話情報生成モジュール40A,40Bでは、コンテンツ進行情報提供装置50からのコンテンツの進行情報に基づいて、情報提供装置1がユーザUに対して音声出力するための発話文を生成する(S02)。生成された発話文は、発話情報生成モジュール40A,40Bから発話管理モジュール20へ送られる(S03)。
発話管理モジュール20では、取得した発話文について、まず、スコア付与部23において、発話文のスコアを算出する(S04)。スコアの算出には、内容スコア算出部24での内容スコアの算出処理、経過時間スコア算出部25での経過時間スコアの算出処理、状況スコア算出部26での状況スコアの算出処理、および、スコア付与部23においてこれらを合算する処理が含まれる。スコアを算出した後、発話待機情報保持部21において、発話文および発話文に対応するスコアが保持される(S05)。なお、発話文を発話待機情報保持部21に保持した(S05)後に、スコアの算出(S04)を行い、スコアを発話文に対応付けて発話待機情報保持部21にて保持する構成としてもよい。
発話管理モジュール20では、必要に応じて、スコア付与部23により、発話待機情報保持部21において保持される発話文に対応付けられたスコアを更新(S06)してもよい。
その後、発話管理モジュール20の発話判定部22は、発話待機情報保持部21を参照し、発話待機情報保持部21に保持された発話文の発話を行うかを判定する(S07)。発話判定部22が発話を行わない都判定した場合には、以降の処理は行われず、定期的に発話判定(S07)が繰り返される。一方、発話を行うと判定した場合には、発話判定部22により、音声情報として出力する発話文が対話モジュール10へ送られる(S08)。そして、対話モジュール10により発話文が音声へと変換されて、ユーザUへの出力、すなわち、発話が行われる(S09)。
以上のように、本実施形態に係る情報提供装置1は、ユーザUに対して発話により音声情報を提供する情報提供装置であって、ユーザUに対して発話する候補となる発話文に対して、発話文の発話の優先度に関係する数値であるスコアを算出して付与するスコア付与部23と、発話文と、発話文に対してスコア付与部により付与されたスコアとを対応付けて保持する発話待機情報保持部21と、発話待機情報保持部21に保持されているスコアのうち最も高いスコアに対応付けられて保持されている発話文を選択する発話情報選択部としての発話判定部22と、発話情報選択部としての発話判定部22により選択された発話文を音声情報として出力する出力部としての対話モジュール10と、を有する。
上記の情報提供装置1によれば、発話文の発話の優先度に関係する数値であるスコアを算出して発話文毎に付与し、発話文に対応付けて発話待機情報保持部21により保持される。また、最も高いスコアに対応付けられた発話文が、発話情報選択部としての発話判定部22により選択されて、出力部としての対話モジュール10により音声情報として出力される。情報提供装置1では、このような構成を有することで、優先度に関係したスコアに基づいて、発話文が選択されて音声情報として出力することができるから、優先度に応じてユーザに対してより適切な発話を行うことが可能となる。
また、情報提供装置1では、発話情報選択部としての発話判定部22において、発話待機情報保持部21に保持されているスコアのうち最も高いスコアに対応付けられて保持されている発話文が、所定の条件を満たす場合に、当該発話文を選択する。このような構成を有していることで、スコアが最も高いだけでなく、そのほかの条件も満たしたスコアが付与された発話文を音声情報として出力することができる。したがって、優先度に応じてユーザに対してより適切な発話を行うことが可能となる。
なお、上記実施形態では、所定の条件は、スコアが所定の閾値以上であるか否かとされている。このような構成とすることで、スコアが所定の閾値より大きい、すなわち、優先度が十分に高いと考えられる発話文を音声情報として出力することができる。したがって、発話待機情報保持部に保持されている発話文のうちスコアが最も高いとしても、優先度が十分に高いとはいえない発話文を音声情報として出力することが防がれるため、ユーザに対してより適切な発話を行うことができる。
また、スコア付与部23は、発話文の内容に対応する内容スコアに基づいて、スコアを算出する構成とされている。
発話文の内容に対応する内容スコアに基づいてスコアを算出する構成とすることで、発話文の内容に応じた適切なスコアを付与することができる。そのため、例えば、重要な内容に係る発話文に対してより優先度が高いことを示すスコアを付与することができ、ユーザに対してより適切な発話を行うことができる。
また、スコア付与部23は、自装置による前回の発話からの経過時間に係る経過時間スコアに基づいて、スコアを算出する構成とされている。
自装置による前回の発話からの経過時間に係る経過時間スコアに基づいてスコアを算出する構成とすることで、経過時間を考慮したスコアを付与することができる。そのため、例えば、前回の発話からの経過時間が短すぎる場合に発話を行うことなどを防ぐことも可能となるため、ユーザに対してより適切な発話を行うことができる。
また、スコア付与部23は、音声情報を提供する対象となるコンテンツの状況に係る状況スコアに基づいて、スコアを算出する構成とされている。
コンテンツの状況に係る状況スコアに基づいてスコアを算出する構成とすることで、コンテンツの状況に応じた適切なスコアを付与することができる。そのため、例えば、コンテンツの状況から音声情報の提供を減らしたほうがよい場合には、スコアを低くするなど、音声情報の提供が望まれるタイミング等を考慮したスコアを付与することができ、ユーザに対してより適切な発話を行うことができる。
なお、上記実施形態で説明した情報提供装置1は上記の構成に限定されず、種々の変更を加えることができる。
上記実施形態では、情報提供装置1が1台の装置により構成されている場合について説明したが、上記の情報提供装置1に係る機能が複数台の装置に分散配置された構成であってもよい。例えば、情報提供装置1を構成する各モジュールが個別の装置であってもよい。また、各モジュールが、それぞれ複数台の装置により構成されていてもよい。
また、上記実施形態では、情報提供装置1がユーザUからの発話(問い合わせ)に対して応答する機能を有している場合について説明したが、情報提供装置1は、少なくとも発話による音声情報の出力に係る機能を有していればよい。
また、上記実施形態では、スコア付与部23において、内容スコア、経過時間スコア、および、状況スコアを算出する構成について説明したが、スコア付与部23が付与するスコアには、内容スコア、経過時間スコア、および、状況スコアのいずれかが含まれていなくてもよい。また、スコア付与部23は、上記の3つのスコアとは異なる情報等に基づいてスコアを算出してもよい。さらに、スコア付与部23は、上記の3つのスコアと、その他の情報に基づいて算出されるスコアとを組み合わせてスコアを算出してもよい。このように、スコア付与部23により付与されるスコアの算出方法は、適宜変更することができる。
また、上記実施形態では、発話判定部22において発話文のスコアが最も高くかつ所定の閾値以上である場合に、音声情報として発話すると判断する構成について説明している。ただし、発話判定部22は、発話待機情報保持部21において保持されている発話文のうち最もスコアが高い発話文について、その他の条件を満たしている場合に当該発話文を選択する構成としてもよい。その他の条件とは、例えば、発話文の長さが所定の文字数以下である、等であってもよい。情報提供装置1からの音声情報の出力に係る機能等を考慮して、その他の条件(所定の条件)を設定してもよい。また、発話判定部22は、発話待機情報保持部21において保持されている発話文のうち、最もスコアが高い発話文を選択する構成としてもよい。この場合、発話判定部22による発話文の選択タイミング(定期的な発話文の選択のタイミング)を調整することなどにより、音声情報の出力の頻度を調整してもよい。
(その他)
上記実施の形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置により実現されてもよいし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線)で接続し、これら複数の装置により実現されてもよい。
例えば、本開示の一実施の形態における情報提供装置1は、本実施形態の情報提供装置1の処理を行うコンピュータとして機能してもよい。図5は、本実施形態に係る情報提供装置1のハードウェア構成の一例を示す図である。上述の情報提供装置1は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。情報提供装置1のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
情報提供装置1における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることで、プロセッサ1001が演算を行い、通信装置1004による通信や、メモリ1002及びストレージ1003におけるデータの読み出し及び/又は書き込みを制御することで実現される。
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインタフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)で構成されてもよい。例えば、情報提供装置1の各機能は、プロセッサ1001で実現されてもよい。
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュールやデータを、ストレージ1003及び/又は通信装置1004からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、情報提供装置1の各機能は、メモリ1002に格納され、プロセッサ1001で動作する制御プログラムによって実現されてもよい。上述の各種処理は、1つのプロセッサ1001で実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つで構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係る方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つで構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及び/又はストレージ1003を含むデータベース、サーバその他の適切な媒体であってもよい。
通信装置1004は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。例えば、情報提供装置1の各機能は、通信装置1004で実現されてもよい。
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
また、プロセッサ1001やメモリ1002などの各装置は、情報を通信するためのバス1007で接続される。バス1007は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。
また、情報提供装置1は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つで実装されてもよい。
以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。
情報の通知は、本明細書で説明した態様/実施形態に限られず、他の方法で行われてもよい。例えば、情報の通知は、物理レイヤシグナリング(例えば、DCI(Downlink Control Information)、UCI(Uplink Control Information))、上位レイヤシグナリング(例えば、RRC(Radio Resource Control)シグナリング、MAC(Medium Access Control)シグナリング、報知情報(MIB(Master Information Block)、SIB(System Information Block)))、その他の信号又はこれらの組み合わせによって実施されてもよい。また、RRCシグナリングは、RRCメッセージと呼ばれてもよく、例えば、RRC接続セットアップ(RRC Connection Setup)メッセージ、RRC接続再構成(RRC Connection Reconfiguration)メッセージなどであってもよい。
本開示において説明した各態様/実施形態は、LTE(Long Term Evolution)、LTE-A(LTE-Advanced)、SUPER 3G、IMT-Advanced、4G(4th generation mobile communication system)、5G(5th generation mobile communication system)、FRA(Future Radio Access)、NR(new Radio)、W-CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broadband)、IEEE 802.11(Wi-Fi(登録商標))、IEEE 802.16(WiMAX(登録商標))、IEEE 802.20、UWB(Ultra-WideBand)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及びこれらに基づいて拡張された次世代システムの少なくとも一つに適用されてもよい。また、複数のシステムが組み合わされて(例えば、LTE及びLTE-Aの少なくとも一方と5Gとの組み合わせ等)適用されてもよい。
本明細書で説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。
情報等は、上位レイヤ(又は下位レイヤ)から下位レイヤ(又は上位レイヤ)へ出力され得る。複数のネットワークノードを介して入出力されてもよい。
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:trueまたはfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
また、ソフトウェア、命令などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線(DSL)などの有線技術及び/又は赤外線、無線及びマイクロ波などの無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれる。
本開示で説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
なお、本開示で説明した用語及び/又は本開示の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。
本開示で使用する「システム」および「ネットワーク」という用語は、互換的に使用される。
また、本開示で説明した情報、パラメータなどは、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。
上述したパラメータに使用する名称はいかなる点においても限定的なものではない。さらに、これらのパラメータを使用する数式等は、本明細書で明示的に開示したものと異なる場合もある。
上述したパラメータに使用する名称はいかなる点においても限定的な名称ではない。さらに、これらのパラメータを使用する数式等は、本開示で明示的に開示したものと異なる場合もある。
本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up)(例えば、テーブル、データベースまたは別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。
「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。本開示で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及び/又はプリント電気接続を使用することにより、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギーなどの電磁エネルギーを使用することにより、互いに「接続」又は「結合」されると考えることができる。
本開示で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
「含む(include)」、「含んでいる(including)」、およびそれらの変形が、本開示あるいは請求の範囲で使用されている限り、これら用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示あるいは請求の範囲において使用されている用語「または(or)」は、排他的論理和ではないことが意図される。
本開示において、文脈または技術的に明らかに1つのみしか存在しない装置である場合以外は、複数の装置をも含むものとする。本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。
本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。
本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。