JP7267234B2 - 音声出力制御装置、音声出力制御方法および音声出力制御プログラム - Google Patents

音声出力制御装置、音声出力制御方法および音声出力制御プログラム Download PDF

Info

Publication number
JP7267234B2
JP7267234B2 JP2020087908A JP2020087908A JP7267234B2 JP 7267234 B2 JP7267234 B2 JP 7267234B2 JP 2020087908 A JP2020087908 A JP 2020087908A JP 2020087908 A JP2020087908 A JP 2020087908A JP 7267234 B2 JP7267234 B2 JP 7267234B2
Authority
JP
Japan
Prior art keywords
sentence
data
primary
sentence data
output control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020087908A
Other languages
English (en)
Other versions
JP2021182094A (ja
Inventor
忠 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2020087908A priority Critical patent/JP7267234B2/ja
Publication of JP2021182094A publication Critical patent/JP2021182094A/ja
Application granted granted Critical
Publication of JP7267234B2 publication Critical patent/JP7267234B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Navigation (AREA)
  • Document Processing Apparatus (AREA)

Description

本開示は、文章の読み上げ音声の出力制御に関する。
車両の運転者等の利用者に対する情報提供方法として、テキストを音声に変換して読み上げる方法がある。その一例として、特許文献1には、SNSへの投稿メッセージを読み上げる投稿メッセージ出力装置が開示されている。
音声出力による情報提供は、読み上げの頻度が高く、または読み上げる文章の情報量が多い場合には、運転者に煩わしさを与えてしまう他、運転者が情報を聞き漏らしてしまうという問題があった。これに対して、特許文献1の投稿メッセージ出力装置では、予め定めた登録文言を含む投稿メッセージを特定し、特定した複数の投稿メッセージのうち少なくとも1つの投稿メッセージの読み上げを行わないという対応をとっている。これにより、同種の登録文言が繰り返し読み上げられる回数が低減する。
特開2015-162010号公報
しかし、特許文献1の投稿メッセージ出力装置によれば、他の投稿メッセージと重複しない重要な情報を含む投稿メッセージであっても、他の投稿メッセージと重複する登録文言を含むために、読み上げが行われないことがあり得る。
本開示は、上記の問題点を解決するためになされたものであり、情報量をなるべく削減せずに利用者の聞き取り負荷を軽減する文章の読み上げ技術の提供を目的とする。
本開示の音声出力制御技術は、複数の一次文章データを順次取得し、一つ前の一次文章データに対する一次文章データの相違部分を二次文章データとして作成し、二次文章データの合成音声データを作成し、車両に搭載されたスピーカーから出力する。
本開示の音声出力制御技術によれば、一つ前の一次文章データに対する一次文章データの相違部分の合成音声データをスピーカーから出力する。従って、一つ前に読み上げられた文章と異なる部分は読み上げられつつ、同じ文言が繰り返し読み上げられることが抑制される。その結果、文章の読み上げによって利用者に情報を提供する際、情報量をなるべく削減せず、利用者の情報の聞き取り負荷を小さくすることが可能となる。
実施の形態1の音声出力制御装置の構成を示すブロック図である。 実施の形態1の文書作成部の動作を示すフローチャートである。 実施の形態1の音声合成部の動作を示すフローチャートである。 実施の形態1の変形例の文書作成部の動作を示すフローチャートである。 実施の形態2の音声出力制御装置の構成を示すブロック図である。 実施の形態2の文書作成部の動作を示すフローチャートである。 実施の形態3の音声出力制御装置の構成を示すブロック図である。 実施の形態3の二次文章データ作成ルールを示す図である。 実施の形態3の文書作成部の動作を示すフローチャートである。 実施の形態4の音声出力制御装置の構成を示すブロック図である。 実施の形態4の二次文章データ作成ルールを示す図である。 実施の形態4の文書作成部の動作を示すフローチャートである。 音声出力制御装置のハードウェア構成を示す図である。 音声出力制御装置のハードウェア構成を示す図である。 サーバと車両による音声出力制御装置の構成例を示す図である。
<A.実施の形態1>
<A-1.構成>
図1は、実施の形態1の音声出力制御装置101の構成を示すブロック図である。音声出力制御装置101は、情報提供装置51およびスピーカー52と接続され、これらを利用可能に構成されている。音声出力制御装置101の利用者は、車両の搭乗者であり、典型的には運転者である。以下の説明では、運転者を音声出力制御装置101の利用者とする。
情報提供装置51は、複数の一次文章データを逐次、音声出力制御装置101に出力する。一次文章データとは、読み上げるべき一次文章のテキストデータである。但し、音声出力制御装置101は一次文章を常にそのまま読み上げるのではなく、必要に応じて前回の一次文章との重複部分を省略した二次文章に変換した上で、読み上げを行う。
一次文章の例として、ナビゲーション装置による案内情報が挙げられる。案内情報としての一次文章には、例えば「50m先のA交差点を右折です」などの経路案内文言がある。こうした案内情報は、車両に搭載された表示装置に表示されることで運転者に提供されることも可能である。しかし、運転者は、車両の前方または側方など様々な場所に視線を移して安全確認を行いながら運転を行うため、表示装置を一定時間視認して案内情報を確認することが常に可能とは限らない。そこで、音声出力制御装置101は、上記のとおり一次文章を二次文章に変換し、二次文章の読み上げ音声をスピーカー52から出力させる。文章の読み上げによれば、運転者が視線を移動することなく情報を確認することができる。
文章作成部11Aは、情報提供装置51から複数の一次文章データを逐次取得する。文章作成部11Aは、情報提供装置51から新たな一次文章データを取得すると、その一次文章データを二次文章のテキストデータである二次文章データに変換し、音声合成部12Aに出力する。そして、文章作成部11Aは、情報提供装置51から次の一次文章データが入力されるのを待って、同様の処理を行う。このように、文章作成部11Aは複数の一次文章データに逐次的に処理を行うため、以下の説明では、現在の処理対象の一次文章を「今回の一次文章データ」、一つ前の処理対象の一次文章を「前回の一次文章」と称する。
文章作成部11Aは、前回の一次文章に対する今回の一次文章の相違部分を二次文章として抽出し、二次文章データを音声合成部12Aに出力する。文章作成部11Aは、二次文章データを音声合成部12Aに出力すると、当該二次文章データの作成元の一次文章データを出力済データとして出力済データ格納部13に格納する。出力済データ格納部13には、常に最も新しい出力済データ、すなわち前回の一次文章データが格納されており、文章作成部11Aは今回の一次文章データを出力済データと比較することにより二次文章データの作成を行う。なお、今回の一次文章が前回の一次文章と重複しない場合には、今回の一次文章の全体が前回の一次文章に対する相違部分である。従って、一次文章データは二次文章データと等しくなる。また、今回の一次文章が前回の一次文章と完全同一である場合には、相違部分が存在しないため、二次文章データは存在しない。
音声合成部12Aは、文章作成部11Aから取得した二次文章データの合成音声データを作成し、スピーカー52に出力する。これにより、スピーカー52から二次文章の読み上げ音声が出力され、運転者は二次文章を聞き取ることができる。
文章の読み上げには一定の時間を要するため、複数の文章の読み上げタイミングが重ならないよう、情報提供装置51から文章作成部11Aに対する一次文章の入力間隔は配慮されることが望ましい。そのため、音声合成部12Aは、合成音声データをスピーカー52へ出力した後、二次文章の読み上げ時間に相当する一定時間の経過後、情報提供装置51へ読み上げ完了通知を行う。情報提供装置51は、音声合成部12Aから読み上げ完了通知を取得した後、次の一次文章データを文章作成部11Aに出力する。
上記の読み上げ完了通知に関する構成は、複数の文章の読み上げが重ならないようにする方策の一例に過ぎず、情報提供装置51に必須の構成ではない。他の方法として、情報提供装置51は、文章の読み上げ時間を考慮して予め定められた一定時間ごとに、一次文章データを文章作成部11Aに送信しても良い。
<A-2.動作>
図2は、実施の形態1の文章作成部11Aの動作を示すフローチャートである。以下、図2のフローに沿って文章作成部11Aの動作を説明する。まず、文章作成部11Aは、情報提供装置51から一次文章データの入力があったか否かを判断する(ステップS102)。文章作成部11Aは、情報提供装置51から一次文章データの入力があるまで待機する。情報提供装置51から一次文章データの入力があると、文章作成部11Aは、出力済データ格納部13に格納された出力済データを参照し、一次文章データに出力済データとの相違部分があるか否かを判断する(ステップS105)。
ステップS105において、一次文章データに出力済データとの相違部分がなければ、すなわち一次文章データが出力済データと全く同じであれば、文章作成部11Aは二次文章データバッファにnullを書き込み(ステップS107)、ステップS114に移行する。
他方、ステップS105において、一次文章データに出力済データとの相違部分があれば、文章作成部11Aは二次文章データバッファに相違部分を書き込む(ステップS108)。ここで、一次文章データと出力済みデータの間に重複部分がなければ、一次文章データの全体が相違部分となる。そして、文章作成部11Aは、一次文章データを出力済データとして保存し(ステップS111)、ステップS114に移行する。文章作成部11Aは、ステップS111で保存した出力済データを、次のステップS105において参照する。
ステップS114において、文章作成部11Aは、二次文章データバッファに書き込まれたデータを二次文章データとして音声合成部12Aに出力する。そして、文章作成部11Aの処理はステップS102に戻る。
図3は、音声合成部12Aの動作を示すフローチャートである。以下、図3のフローに沿って音声合成部12Aの動作を説明する。まず、音声合成部12Aは、二次文章データの合成音声データを作成する(ステップS151)。次に、音声合成部12Aは、合成音声データをスピーカー52に出力する(ステップS152)。こうして、スピーカー52から二次文章の読み上げ音声が出力される。但し、図2のステップS107で説明したように二次文章データがnullである場合、合成音声データの信号は長さがゼロとなり、スピーカー52から出力されても無音となる。
次に、音声合成部12Aは、ステップS152の後、二次文章の読み上げ時間が経過したか否かを判断する(ステップS153)。ステップS153で判断する読み上げ時間は、例えば二次文章の文字数等に応じて定められても良いし、二次文章に想定される最大文字数に応じた一定時間であっても良い。音声合成部12Aは、ステップS153において二次文章の読み上げ時間が経過するまで待機し、二次文章の読み上げ時間が経過すると、読み上げ完了通知を情報提供装置51に行う(ステップS154)。
<A-3.変形例>
図2のフローにおいて、文章作成部11Aは、今回の一次文章データの出力済データに対する相違部分がどのような内容であっても、相違部分を二次文章データとした。しかし、文章作成部11Aは、今回の一次文章データの出力済データに対する相違部分が特定項目を表す場合に限って、相違部分を二次文章データとしても良い。特定項目を表す部分とは、例えば、時間、距離、量、車両の重さ、ヘッドライトまたは環境の明るさ、速度、エンジンの回転数、バッテリーの電圧、タイヤの空気圧、車両の加速度、高度、気圧、雨量、外気温、エンジン冷却水またはエンジンオイルの温度、もしくは風速などを数値で表す数値表現部分が該当する。ここで、数値表現部分は、数値のみを含んでも良いし、数値と単位を含んでも良い。また、風向などの数値以外を表す部分も特定項目に含まれる。
図4は、一次文章データの出力済データに対する相違部分が特定項目を表す場合に限って相違部分を二次文章データとする変形例における文章作成部11Aの動作を示すフローチャートである。図4のフローは、ステップS105とステップS108またはステップS109の間にステップS106を有する。すなわち、文章作成部11Aは、ステップS105において一次文章データに出力済データとの相違部分があると判断すると、相違部分が特定項目のみか否かを判断する(ステップS106)。相違部分が特定項目のみであれば、文章作成部11Aは、二次文章データバッファに相違部分を書き込む(ステップS108)。一方、相違部分が特定項目以外を含む場合は、文章作成部11Aは、二次文章データバッファに一次文章データを書き込む(ステップS109)。
<A-4.効果>
実施の形態1の音声出力制御装置101は、複数の一次文章データを順次取得し、一つ前の一次文章データに対する一次文章データの相違部分を二次文章データとして作成する文章作成部11Aと、二次文章データの合成音声データを作成し、車両に搭載されたスピーカーから出力する音声合成部と、を備える。
文章作成部11Aは、相違部分が数値を表す数値表現部分のみである場合に、相違部分を二次文章データとし、相違部分が数値表現部分以外を含む場合に、一次文章データを二次文章データとしてもよい。これにより、数値表現部分のみが異なる一次文章が連続して情報提供装置51から入力される場合に、音声出力制御装置101は、数値表現部分のみを読み上げることによって、利用者の聞き取り負荷を軽減することができる。
<B.実施の形態2>
<B-1.構成>
図5は、実施の形態2の音声出力制御装置102の構成を示すブロック図である。音声出力制御装置102は、情報提供装置51およびスピーカー52と接続され、これらを利用可能に構成されている。音声出力制御装置102は、実施の形態1の音声出力制御装置101の構成において、文章作成部11Aに代えて文章作成部11Bを有し、音声合成部12Aに代えて音声合成部12Bを有し、タイマー14をさらに備えている。
タイマー14は、スピーカー52から読み上げ音声が出力されてから、次の読み上げ音声を出力するまでの経過時間をカウントする。
文章作成部11Bは、二次文章データを作成する際、前回の読み上げ音声の出力から時間が十分に経過していれば、一次文章データと出力済データの間の相違部分の有無に関わらず、一次文章データをそのまま二次文章データとする。つまり、音声出力制御装置102では、前回の読み上げ音声の出力からの経過時間が第1閾値以上であれば、前回の読み上げ音声と重複する文言が一次文章に含まれる場合でも、一次文章の全体を再び読み上げることとする。前回の読み上げ音声の出力から時間が十分に経過していれば、同じ文言が再び読み上げられても、運転者に煩わしさを与えないからである。
音声合成部12Bは、スピーカー52における音声の読み上げが終了したタイミングで、出力完了通知と同時にタイマー14をスタートする。
<B-2.動作>
図6は、実施の形態2の文章作成部11Bの動作を示すフローチャートである。以下、図6のフローに沿って文章作成部11Bの動作を説明する。まず、文章作成部11Bは、初期設定として、タイマー14のカウンターTcを0にリセットする(ステップS101)。次に、文章作成部11Bは、情報提供装置51からの一次文章データの入力を待機する(ステップS102)。情報提供装置51から一次文章データの入力があると、文章作成部11Bは、タイマー14のカウンターTcが第1閾値Pth以上であるか否かを判断する(ステップS104)。ステップS104において、カウンターTcが第1閾値Pth以上であれば、文章作成部11Bは、一次文章データと出力済データとの相違部分を判断することなく、二次文章データバッファに一次文章データを書き込む(ステップS109)。
ステップS104において、カウンターTcが第1閾値Pth未満であれば、文章作成部11Bは、一次文章データに出力済データとの相違部分があるか否かを判断し(ステップS105)、相違部分に応じて二次文章データを作成する(ステップS106、S107、S108)。そして、文章作成部11Bは、一次文章データを出力済文章データとして出力済データ格納部13に保存する(ステップS111)。次に、文章作成部11Bは、タイマー14を停止し、リセットする(ステップS113)。
一方、ステップS105において一次文章データに出力済データとの相違部分がなければ、文章作成部11Bは二次文章データバッファにnullを書き込み(ステップS107)、タイマー14を停止する(ステップS112)。
ステップS112またはステップS113の後、文章作成部11Bは、二次文章データバッファの内容を二次文章データとして音声合成部12Bに出力する(ステップS114)。
<B-3.効果>
実施の形態2の音声出力制御装置102は、一つ前の一次文章データに対する二次文章データの合成音声データがスピーカーから出力されてからの経過時間をカウントするタイマー14を備え、文章作成部11Bは、タイマー14のカウンターTcが第1閾値Pth未満である場合に、相違部分を二次文章データとする。従って、音声出力制御装置102によれば、前回の読み上げ完了からの経過時間が長ければ一次文章をそのまま読み上げることにより、運転者の聞き漏れを防ぐことができる。
<C.実施の形態3>
<C-1.構成>
図7は、実施の形態3の音声出力制御装置103の構成を示すブロック図である。音声出力制御装置103は、情報提供装置51およびスピーカー52と接続され、これらを利用可能に構成されている。音声出力制御装置103は、実施の形態2の音声出力制御装置102の構成に加えて、作成ルール格納部15を備え、文章作成部11Bに代えて文章作成部11Cを備えている。
作成ルール格納部15には、一次文章データから二次文章データを作成するルール(以下、「二次文章作成ルール」と称する)が格納されている。文章作成部11Cは、二次文章作成ルールに沿って二次文章データを作成する。
図8には、実施の形態3の二次文章作成ルールが例示されている。図8において、二次文章作成ルールは、パターンナンバーn、照合パターンR(n)、タイマー閾値T1(n)、および二次文章データが紐づけられたデータである。文章作成部11Cは、一次文章データが二次文章作成ルールにおけるどの照合パターンR(n)と一致するかを判断し、一致する照合パターンR(n)に紐づけられた二次文章データを作成する。例えば、n=1の照合パターンR(1)は、「(距離)先の(交差点名)を右折です」である。ここで、(距離)とは、「100m」または「1km」など距離を表す数値部分であり、任意の距離と一致する。また、(交差点名)とは、「A交差点」または「B交差点」など交差点名を表す部分であり、任意の交差点名と一致する。また、(時間)とは、「30秒」または「5分」など時間を表す数値部分であり、任意の時間と一致する。このように、各照合パターンR(n)においてかっこ書きで記載された部分は、かっこ書きの内容を表す任意の記載と一致するワイルドカードである。
例えば、前回の一次文章を「100m先のA交差点を左折です」とし、今回の一次文章を「50m先のA交差点を左折です」とする。これら2つの一次文章は、いずれも照合パターンR(2)に一致する。前回の読み上げ完了からの経過時間をカウントするタイマー14のカウンターTcが第1閾値Pth以上であれば、文章作成部11Cは、一次文章「50m先のA交差点を左折です」を二次文章とする。また、カウンターTcが第1閾値Pth未満であれば、今回の一次文章の前回の一次文章に対する相違部分である距離を表す「50m」を二次文章とする。このように、今回の一次文章の全体が二次文章となるか、相違部分のみが二次文章となるかは、タイマー14のカウンターTcによる。ここで、第1閾値Pthには、前回の一次文章に一致する照合パターンR(2)に対応するタイマー閾値T(2)=t2が設定される。
<C-2.動作>
図9は、実施の形態3の文章作成部11Cの動作を示すフローチャートである。以下、図9のフローに沿って文章作成部11Cの動作を説明する。まず、文章作成部11Cは、初期設定として、タイマー14のカウンターTcを0にリセットし、第1閾値Pthに予め定められた初期値を設定する(ステップS101)。次のステップS102は実施の形態2と同様である。文章作成部11Cは、情報提供装置51から一次文章データの入力を受けると(ステップS102でYes)、二次文章作成ルールを参照し一次文章データに合致する照合パターンR(n)のパターンナンバーnを取得する(ステップS103)。ステップS104からS109は実施の形態2と同様である。
文章作成部11Cは、二次文章データバッファに、出力済データに対する一次文章データの相違部分(ステップS108)、または一次文章データそのもの(ステップS109)を書き込んだ後、タイマー閾値T(n)を第1閾値Pthとする(ステップS110)。ここで、タイマー閾値T(n)は、ステップS103で文章作成部11Cが取得したパターンナンバーnに対応する閾値であり、例えばn=3の場合はT(3)=t3である。文章作成部11Cは、本ステップで設定した第1閾値Pthを、次回の一次文章データに対して二次文章を作成する際にステップS104で用いる。このように、文章作成部11Cは、前回の一次文章データに一致する照合パターンR(n)に応じて第1閾値Pthを定める。これにより、文章作成部11Cは、前回の読み上げ音声の作成元である一次文章データの内容に応じて、相違部分のみを読み上げるべきか否かを判断するための、前回の読み上げ完了からの経過時間の閾値を適切に設定することが可能である。なお、本実施の形態では、一次文章データを予め用意した照合パターンR(n)と照合する方法を説明したが、これは一例であり、文章作成部11Cは、第1閾値Pthを一つ前の一次文章データに応じて定めればよい。
<C-3.効果>
実施の形態3の音声出力制御装置103において、文章作成部11Cは、第1閾値Pthを一つ前の一次文章データに応じて定める。これにより、文章作成部11Cは、前回スピーカー52から読み上げられた音声に対応する一次文章データの内容に応じて、前回の読み上げ時間から、相違部分のみを読み上げる次の読み上げ時間までの経過時間の閾値を適切に設定することが可能である。
また、文章作成部11Cは、一次文章データを予め定められた複数の照合パターンと比較し、一つ前の一次文章データに一致する照合パターンR(n)に応じて第1閾値Pthを定める。これにより、文章作成部11Cは、前回スピーカー52から読み上げられた音声に対応する一次文章データの内容に応じて、前回の読み上げ時間から、相違部分のみを読み上げる次の読み上げ時間までの経過時間の閾値を適切に設定することが可能である。
<D.実施の形態4>
<D-1.構成>
図10は、実施の形態4の音声出力制御装置104の構成を示すブロック図である。音声出力制御装置104は、情報提供装置51およびスピーカー52と接続され、これらを利用可能に構成されている。音声出力制御装置104は、実施の形態3の音声出力制御装置103の構成において、文章作成部11Cに代えて文章作成部11Dを備えている。また、実施の形態4では、作成ルール格納部15に格納される二次文章作成ルールが実施の形態3と一部異なる。
図11は、実施の形態4の二次文章作成ルールを示す図である。図11において、二次文章作成ルールは、パターンナンバーn、照合パターンR(n)、タイマー閾値T1(n),T2(n)、短縮文章パターンSp(n)および二次文章データが紐づけられたデータである。実施の形態4の二次文章作成ルールでは、タイマー閾値が2つあり、T1(n)<T2(n)である。
文章作成部11Dは、一次文章データが二次文章作成ルールにおけるどの照合パターンR(n)と一致するかを判断し、一致する照合パターンR(n)に紐づけられた二次文章データを作成する。
例えば、前回の一次文章を「100m先のA交差点を左折です」とし、今回の一次文章を「50m先のA交差点を左折です」とする。これら2つの一次文章は、いずれも照合パターンR(2)に一致する。前回の読み上げ完了からの経過時間をカウントするタイマー14のカウンターTcが第1閾値Pth2以上であれば、文章作成部11Dは、一次文章「50m先のA交差点を左折です」を二次文章とする。また、カウンターTcが第2閾値Pth1未満であれば、今回の一次文章の前回の一次文章に対する装置部分である距離を表す「50m」を二次文章とする。また、文章作成部11Dは、Tcが第2閾値Pth1以上第1閾値Pth2未満の場合は、短縮文章パターンSp(2)「50m先、左折」を二次文章とする。短縮文章パターンSp(n)とは、一次文章データの出力済データに対する共通部分の一部を省略した文章のパターンである。上記の例では、距離を表す部分を除いた「先のA交差点を左折です」が共通部分であるが、このうち、「のA交差点を」と「です」を今回の一次文章から省略した短縮文章「50m先、左折」が二次文章となる。短縮文章は、前回の一次文章に対する今回の一次文章の相違部分のみを抜き出した文章よりは情報量が多いが、一次文章よりは情報量が少ない。短縮文章において省略される文言は、日本語の文章においては、主に助詞または助動詞である。
このように、今回の一次文章の全体が二次文章となるか、相違部分のみが二次文章となるか、短縮文章が二次文章となるかは、タイマー14のカウンターTcによる。ここで、第1閾値Pth2には、前回の一次文章に一致する照合パターンR(2)に対応するタイマー閾値T2(2)=t22が設定され、第2閾値Pth1には、前回の一次文章に一致する照合パターンR(2)に対応するタイマー閾値T1(2)=t12が設定される。
<D-2.動作>
図12は、実施の形態4の文章作成部11Dの動作を示すフローチャートである。以下、図12のフローに沿って文章作成部11Dの動作を説明する。まず、文章作成部11Dは、初期設定として、タイマー14のカウンターTcを0にリセットし、第1閾値Pth2および第2閾値Pth1に予め定められた初期値を設定する(ステップS201)。但し、Pth1<Pth2とする。次に、文章作成部11Dは、情報提供装置51から一次文章データの入力を待機する(ステップS202)。情報提供装置51から一次文章データが入力されると、文章作成部11Dは、二次文章作成ルールを参照し、一次文章データに合致する照合パターンR(n)のパターンナンバーnを取得する(ステップS203)。
次に、文章作成部11Dは、出力済データ格納部13に格納された出力済データを参照し、一次文章データに出力済データとの相違部分があるか否かを判断する(ステップS204)。ステップS204において一次文章データに出力済データとの相違部分がなければ、文章作成部11Dは二次文章データバッファにnullを書き込む(ステップS207)。そして、文章作成部11Dはタイマー14を停止し(ステップS213)、ステップS215の処理に移行する。
ステップS204において一次文章データに出力済データとの相違部分があれば、文章作成部11Dは相違部分が特定項目のみであるか否かを判断する(ステップS205)。ステップS205において相違部分が特定項目以外を含む場合、文章作成部11Dは二次文章データバッファに一次文章を書き込む(ステップS210)。ステップS205において相違部分が特定項目のみである場合、文章作成部11Dはタイマー14のカウンターTcの値を判定する(ステップS206)。Tcが第2閾値Pth1未満である場合、文章作成部11Dは二次文章データバッファに相違部分を書き込んで(ステップS208)、ステップS211の処理に移行する。Tcが第2閾値Pth1以上第1閾値Pth2未満である場合、文章作成部11Dは二次文章データバッファに短縮文章データを書き込んで(ステップS209)、ステップS211の処理に移行する。Tcが第1閾値Pth2以上である場合、文章作成部11Dは二次文章データバッファに一次文章データを書き込んで(ステップS210)、ステップS211の処理に移行する。
ステップS211において、文章作成部11Dは、ステップS203で取得したパターンナンバーnを基に、T1(n)を第2閾値Pth1にセットし、T2(n)を第1閾値Pth2にセットする。本ステップS211でセットした第2閾値Pth1および第1閾値Pth2は、次の一次文章データに対するステップS206の判定処理に用いられる。ステップS211の後、文章作成部11Dは、一次文章データを出力済文章データとして出力済データ格納部13に保存する(ステップS212)。次に、文章作成部11Dは、タイマー14を停止し、リセットする(ステップS214)。
上記では、前回の読み上げ完了からの経過時間に応じて、二次文章を、相違部分のみ、短縮文章、一次文章の全体という3パターンに分けることを説明した。これにより、前回の読み上げ完了からの経過時間が長いほど、読み上げの情報量が多くなる。さらに、短縮文章における文章の省略の程度を、前回の読み上げ完了からの経過時間の長さに応じて多段的に大きくしても良い。
<D-3.効果>
実施の形態4の音声出力制御装置104において、文章作成部11Dは、タイマー14のカウント時間が第1閾値Pth2より短い第2閾値Pth1以上かつ第1閾値Pth2未満である場合に、一次文章データの相違部分以外の一部分を省略した短縮文章データを二次文章データとする。従って、前回の読み上げ完了からの経過時間に応じて、次に読み上げる情報量を細かく調整することができる。
また、文章作成部11Dは、タイマー14のカウント時間が第2閾値Pth1未満である場合に、一次文章データの相違部分を二次文章データとする。従って、前回の読み上げ完了からの経過時間に応じて、次に読み上げる情報量を細かく調整することができる。
また、タイマー14のカウント時間が第2閾値以上かつ第1閾値未満である場合に、タイマー14のカウント時間が短いほど、短縮文章データにおける、一次文章データの相違部分以外の省略の程度を大きくすることによって、前回の読み上げ完了からの経過時間に応じて、次に読み上げる情報量をより細かく調整することができる。
また、第1閾値Pth2および第2閾値Pth1は一つ前の一次文章データに応じて定められる。これにより、文章作成部11Dは、前回スピーカー52から読み上げられた音声に対応する一次文章データの内容に応じて、前回の読み上げ時間から、相違部分のみを読み上げる次の読み上げ時間までの経過時間の閾値を適切に設定することが可能である。
文章作成部11Dは、一次文章データを予め定められた複数の照合パターンと比較し、一つ前の一次文章データに一致する照合パターンに応じて第1閾値および第2閾値を定める。これにより、文章作成部11Cは、前回スピーカー52から読み上げられた音声に対応する一次文章データの内容に応じて、前回の読み上げ時間から、相違部分のみを読み上げる次の読み上げ時間までの経過時間の閾値を適切に設定することが可能である。
<E.ハードウェア構成>
上述した音声出力制御装置101-104における、文章作成部11A,11B,11C,11D、音声合成部12A,12B、出力済データ格納部13、タイマー14および作成ルール格納部15は、図13に示す処理回路81により実現される。すなわち、処理回路81は、文章作成部11A,11B,11C,11D、音声合成部12A,12B、出力済データ格納部13、タイマー14および作成ルール格納部15(以下、「文章作成部等」と称する)を備える。処理回路81には、専用のハードウェアが適用されても良いし、メモリに格納されるプログラムを実行するプロセッサが適用されても良い。プロセッサは、例えば中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、DSP(Digital Signal Processor)等である。
処理回路81が専用のハードウェアである場合、処理回路81は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、またはこれらを組み合わせたものが該当する。文章作成部等の各部の機能それぞれは、複数の処理回路81で実現されてもよいし、各部の機能をまとめて一つの処理回路で実現されてもよい。
処理回路81がプロセッサである場合、文章作成部等の機能は、ソフトウェア等(ソフトウェア、ファームウェアまたはソフトウェアとファームウェア)との組み合わせにより実現される。ソフトウェア等はプログラムとして記述され、メモリに格納される。図14に示すように、処理回路81に適用されるプロセッサ82は、メモリ83に記憶されたプログラムを読み出して実行することにより、各部の機能を実現する。すなわち、音声出力制御装置101-104は、処理回路81により実行されるときに、複数の一次文章データを順次取得するステップと、一つ前の一次文章データに対する一次文章データの相違部分を二次文章データとして作成するステップと、二次文章データの合成音声データを作成するステップと、合成音声データを車両に搭載されたスピーカー52から出力するステップと、が結果的に実行されることになるプログラムを格納するためのメモリ83を備える。換言すれば、このプログラムは、文章作成部等の手順または方法をコンピュータに実行させるものであるともいえる。ここで、メモリ83には、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)などの、不揮発性または揮発性の半導体メモリ、HDD(Hard Disk Drive)、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD(Digital Versatile Disk)及びそのドライブ装置等、または、今後使用されるあらゆる記憶媒体であってもよい。
以上、文章作成部等の各機能が、ハードウェア及びソフトウェア等のいずれか一方で実現される構成について説明した。しかしこれに限ったものではなく、文章作成部等の一部を専用のハードウェアで実現し、別の一部をソフトウェア等で実現する構成であってもよい。例えば音声出力制御装置101において、文章作成部11Aについては専用のハードウェアとしての処理回路でその機能を実現し、それ以外についてはプロセッサ82としての処理回路81がメモリ83に格納されたプログラムを読み出して実行することによってその機能を実現することが可能である。
以上のように、処理回路は、ハードウェア、ソフトウェア等、またはこれらの組み合わせによって、上述の各機能を実現することができる。なお、出力済データ格納部13および作成ルール格納部15は、メモリ83から構成されるが、それらは単一のメモリ83から構成されてもよいし、それぞれが個別のメモリから構成されてもよい。
音声出力制御装置101-104は、典型的には車載装置であるが、PND(Portable Navigation Device)、通信端末(例えば携帯電話、スマートフォン、およびタブレットなどの携帯端末)、およびこれらにインストールされるアプリケーションの機能、並びにサーバなどを適宜に組み合わせてシステムとして構築されるシステムにも適用することができる。この場合、以上で説明した音声出力制御装置101-104の各機能または各構成要素は、システムを構築する各機器に分散して配置されてもよいし、いずれかの機器に集中して配置されてもよい。図15は、サーバと車両による音声出力制御装置104の構成例を示している。図15において、文章作成部11D、出力済データ格納部13、タイマー14および作成ルール格納部15はサーバに配置され、音声合成部12Bは車両に配置されている。
なお、各実施の形態を自由に組み合わせたり、各実施の形態を適宜、変形、省略したりすることが可能である。
11A,11B,11C,11D 文章作成部、12A,12B 音声合成部、13 出力済データ格納部、14 タイマー、15 作成ルール格納部、51 情報提供装置、52 スピーカー、101,102,103,104 音声出力制御装置。

Claims (14)

  1. 複数の一次文章データを順次取得し、一つ前の前記一次文章データに対する前記一次文章データの相違部分を二次文章データとして作成する文章作成部と、
    前記二次文章データの合成音声データを作成し、車両に搭載されたスピーカーから出力する音声合成部と、を備える、
    音声出力制御装置。
  2. 前記文章作成部は、前記相違部分が数値を表す数値表現部分のみである場合に、前記相違部分を前記二次文章データとする、
    請求項1に記載の音声出力制御装置。
  3. 前記文章作成部は、前記相違部分が前記数値表現部分以外を含む場合に、前記一次文章データを前記二次文章データとする、
    請求項2に記載の音声出力制御装置。
  4. 一つ前の前記一次文章データに対する前記二次文章データの合成音声データが前記スピーカーから出力されてからの経過時間をカウントするタイマーをさらに備え、
    前記文章作成部は、前記タイマーのカウント時間が第1閾値未満である場合に、前記相違部分を前記二次文章データとする、
    請求項1から請求項3のいずれか1項に記載の音声出力制御装置。
  5. 前記文章作成部は、前記タイマーのカウント時間が前記第1閾値(Pth)以上である場合に、前記一次文章データを前記二次文章データとする、
    請求項4に記載の音声出力制御装置。
  6. 前記文章作成部は、前記第1閾値を一つ前の前記一次文章データに応じて定める、
    請求項4または請求項5に記載の音声出力制御装置。
  7. 前記文章作成部は、前記一次文章データを予め定められた複数の照合パターンと比較し、一つ前の前記一次文章データに一致する前記照合パターンに応じて前記第1閾値を定める、
    請求項6に記載の音声出力制御装置。
  8. 前記文章作成部は、前記タイマーのカウント時間が前記第1閾値(Pth2)より短い第2閾値(Pth1)以上かつ前記第1閾値未満である場合に、前記一次文章データの前記相違部分以外の一部分を省略した短縮文章データを前記二次文章データとする、
    請求項4から請求項7のいずれか1項に記載の音声出力制御装置。
  9. 前記文章作成部は、前記タイマーのカウント時間が前記第2閾値未満である場合に、前記一次文章データの前記相違部分を前記二次文章データとする、
    請求項8に記載の音声出力制御装置。
  10. 前記タイマーのカウント時間が前記第2閾値以上かつ前記第1閾値未満である場合に、前記タイマーのカウント時間が短いほど、前記短縮文章データにおける、前記一次文章データの前記相違部分以外の省略の程度は大きい、
    請求項9に記載の音声出力制御装置。
  11. 前記第1閾値および前記第2閾値は一つ前の前記一次文章データに応じて定められる、
    請求項8から請求項10のいずれか1項に記載の音声出力制御装置。
  12. 前記文章作成部は、前記一次文章データを予め定められた複数の照合パターンと比較し、一つ前の前記一次文章データに一致する前記照合パターンに応じて前記第1閾値および前記第2閾値を定める、
    請求項11に記載の音声出力制御装置。
  13. 複数の一次文章データを順次取得し、
    一つ前の前記一次文章データに対する前記一次文章データの相違部分を二次文章データとして作成し、
    前記二次文章データの合成音声データを作成し、
    前記合成音声データを車両に搭載されたスピーカーから出力する、
    音声出力制御方法。
  14. コンピュータを、
    複数の一次文章データを順次取得し、一つ前の前記一次文章データに対する前記一次文章データの相違部分を二次文章データとして作成する文章作成部と、
    前記二次文章データの合成音声データを作成し、車両に搭載されたスピーカーから出力する音声合成部と、を備える、音声出力制御装置として機能させるための、
    音声出力制御プログラム。
JP2020087908A 2020-05-20 2020-05-20 音声出力制御装置、音声出力制御方法および音声出力制御プログラム Active JP7267234B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020087908A JP7267234B2 (ja) 2020-05-20 2020-05-20 音声出力制御装置、音声出力制御方法および音声出力制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020087908A JP7267234B2 (ja) 2020-05-20 2020-05-20 音声出力制御装置、音声出力制御方法および音声出力制御プログラム

Publications (2)

Publication Number Publication Date
JP2021182094A JP2021182094A (ja) 2021-11-25
JP7267234B2 true JP7267234B2 (ja) 2023-05-01

Family

ID=78607030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020087908A Active JP7267234B2 (ja) 2020-05-20 2020-05-20 音声出力制御装置、音声出力制御方法および音声出力制御プログラム

Country Status (1)

Country Link
JP (1) JP7267234B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006039120A (ja) 2004-07-26 2006-02-09 Sony Corp 対話装置および対話方法、並びにプログラムおよび記録媒体
JP2009230062A (ja) 2008-03-25 2009-10-08 Fujitsu Ltd 音声合成装置およびそれを用いた読み上げシステム。

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006039120A (ja) 2004-07-26 2006-02-09 Sony Corp 対話装置および対話方法、並びにプログラムおよび記録媒体
JP2009230062A (ja) 2008-03-25 2009-10-08 Fujitsu Ltd 音声合成装置およびそれを用いた読み上げシステム。

Also Published As

Publication number Publication date
JP2021182094A (ja) 2021-11-25

Similar Documents

Publication Publication Date Title
US10170110B2 (en) System and method for ranking of hybrid speech recognition results with neural networks
JP6556575B2 (ja) 音声処理装置、音声処理方法及び音声処理プログラム
CN109754793B (zh) 用于推荐车辆的功能的装置和方法
CN110673748A (zh) 输入法中候选长句的提供方法及装置
CN108932944B (zh) 解码方法及装置
US11881211B2 (en) Electronic device and controlling method of electronic device for augmenting learning data for a recognition model
JP7158217B2 (ja) 音声認識方法、装置及びサーバ
CN110136715B (zh) 语音识别方法和装置
JP7267234B2 (ja) 音声出力制御装置、音声出力制御方法および音声出力制御プログラム
JPWO2016006038A1 (ja) 音声認識システム及び音声認識方法
Kirov et al. Bayesian speech production: Evidence from latency and hyperarticulation
KR102536944B1 (ko) 음성 신호 처리 방법 및 장치
CN107578774B (zh) 用于促进对时间序列模式的检测的方法和系统
KR102651413B1 (ko) 전자 장치 및 전자 장치의 제어 방법
US20090222266A1 (en) Apparatus, method, and recording medium for clustering phoneme models
US10600405B2 (en) Speech signal processing method and speech signal processing apparatus
RU2705769C1 (ru) Распознавание речи транспортным средством вместе с носимым устройством
JP2011248001A (ja) 音響モデル学習用ラベル作成装置、その方法及びプログラム
CN114694645A (zh) 一种确定用户意图的方法及装置
JP6625961B2 (ja) 発音辞書及び音響モデル生成装置、音声認識装置、方法及びプログラム
JP6428229B2 (ja) テキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラム
US11763831B2 (en) Output apparatus, output method and non-transitory computer-readable recording medium
US20200256689A1 (en) Route searching device, route searching system, and route searching method
CN114927135B (zh) 语音交互方法、服务器及存储介质
CN111797631B (zh) 信息处理方法、装置及电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220617

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230419

R150 Certificate of patent or registration of utility model

Ref document number: 7267234

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150