WO2014049719A1

WO2014049719A1 - 音声出力装置

Info

Publication number: WO2014049719A1
Application number: PCT/JP2012/074709
Authority: WO
Inventors: 丈司京本
Original assignee: 三菱電機株式会社
Priority date: 2012-09-26
Filing date: 2012-09-26
Publication date: 2014-04-03
Also published as: JPWO2014049719A1

Abstract

　この発明の音声出力装置によれば、車内の様々な条件（車両状態）だけではなく、外部からのテキスト情報の発信元やその内容に基づいて、文章（テキスト）の音声出力可否を自動判別して読み上げを行うようにしたので、運転中の運転者のプライバシーを保護して運転者にとって望ましい状態で、かつ、安全に、情報伝達を実現することができる。

Description

音声出力装置

　この発明は、文字（テキスト）を音声で読み上げる機能を備えた音声出力装置に関するものである。

　従来の一般的なＴＴＳ（Ｔｅｘｔ　ｔｏ　Ｓｐｅｅｃｈ）機能は、文字（テキスト）が予め設定された合成音声で読み上げられるものであり、近年の多機能化されるカーマルチメディア機器に搭載されることが考えられる。
　しかし、従来の一般的なＴＴＳ機能は、車両の走行状態や運転者の運転状況を考慮しておらず、高速移動中やカーブ、悪路走行中にも無条件に読み上げられるため、運転者の注意を散漫にさせ、また、複雑な操作により事故の原因になりかねないものであり、運転者の安全について配慮されていない、という問題があった。

　このような問題を解決するために、例えば特許文献１には、車両の乗車状態、車両の走行状態、車両の付属機器の操作状態、天候の状態、運転者の運転状態、車両の位置等に応じて、運転者に対して適切な報知形態で報知することにより、運転の安全性を確保することが可能なカーナビゲーション装置が開示されており、上記の条件にしたがって、例えばメールを読み上げる機能を有することが記載されている。

　また、例えば特許文献２には、電子メール、ニュース、天気、交通情報等の情報を提供する情報通信装置において、同乗者の有無により、メールの着信情報のみの表示として、メールの内容の表示や読み上げは禁止したり、同乗者が誰であるかに応じて、出力に制限をかけたりすることができることが開示されている。

特開２００１－１４１４７５号公報特開２００４－２１３１７５号公報

　しかしながら、例えば特許文献１，２のような従来の装置では、同乗者の有無や車両の走行状態等にしたがって、メール等の読み上げを行うか否かを決定しているだけであるが、実際にＴＴＳ機能を使用するユーザにとっては、メール等の文章の読み上げを行って欲しいか否かは、そのメールの発信元や、メールの内容によることが多い。すなわち、従来の装置では、メールの発信元やメールの内容については考慮されておらず、必ずしもユーザにとって望ましい状態で読み上げが行われるわけではない、という課題があった。

　この発明は、上記のような課題を解決するためになされたものであり、車内の様々な条件（車両状態）だけではなく、外部からのテキスト情報の発信元やその内容に基づいて、文章（テキスト）の音声出力可否を自動判別して読み上げを行うことが可能な音声出力装置を提供することを目的とする。

　上記目的を達成するため、この発明は、車両用の機器に搭載される音声出力装置において、同乗者の有無を取得する同乗者情報取得部と、外部からのテキスト情報を取得するテキスト情報取得部と、前記テキスト情報取得部により取得されたテキスト情報を音声により読み上げる指示を行う制御部と、前記音声による読み上げ「否」の発信元、または、読み上げ「否」のキーワードを記憶する辞書記憶部と、前記制御部からの指示にしたがって前記テキスト情報を音声により読み上げる音声出力部とを備え、前記制御部は、前記同乗者情報取得部による取得結果が同乗者ありの場合であって、前記テキスト情報取得部により取得されたテキスト情報の発信元が前記辞書記憶部に記憶されている読み上げ「否」の発信元に含まれている、または、前記テキスト情報取得部により取得されたテキスト情報の中に前記辞書記憶部に記憶されている読み上げ「否」のキーワードが含まれている場合には、前記音声出力部に対して前記テキスト情報を音声により読み上げる指示を行わずに処理を終了することを特徴とする。

実施の形態１による音声出力装置の内部構成の一例を示すブロック図である。実施の形態１による音声出力装置の処理を示すフローチャートである。読み上げ「否」の発信元リストの一例である。

　以下、この発明の実施の形態について、図面を参照しながら詳細に説明する。
実施の形態１．
　図１は、この発明の実施の形態１による音声出力装置の内部構成の一例を示すブロック図である。この音声出力装置は、車載装置に搭載されているものであり、車両情報取得部１、オーディオ情報取得部２、アナログ信号取得部３、同乗者情報取得部４、テキスト情報取得部５、入力部６、辞書記憶部７、表示部８、音声出力部９および制御部１０を備えている。そして、テキスト情報取得部５により取得された外部からのテキスト情報を、運転中の運転者が表示部８等を見て確認する必要がなく、運転者に対して安全に、情報伝達を実現するものである。

　車両情報取得部１は、例えば車両からのＣＡＮ（Ｃｏｎｔｒｏｌｌｅｒ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）信号等により、車両の速度、ステアリング状態、パーキング状態、ブレーキ状態、ウィンドウ状態など、各種車両情報を取得する。
　オーディオ情報取得部２は、ＣＤやＤＶＤ等のオーディオ機器からの音源情報などを取得する。
　アナログ信号取得部３は、ＦＭ／ＡＭ等からのアナログ信号を取得する。

　また、これら車両情報取得部１、オーディオ情報取得部２、アナログ信号取得部３が、車両状態取得部１１を構成する。
　すなわち、車両状態取得部１１は、各種車両情報、オーディオ機器からの音源情報、ＦＭ／ＡＭ等からのアナログ信号など、車両の走行状態や車内の騒音状態など、車内の様々な条件である車両状態を取得するものである。

　同乗者情報取得部４は、座席の背面や座面に内蔵された荷重センサやカメラ等のセンサにより検出された同乗者の有無情報を取得する。
　テキスト情報取得部５は、インターネットを介して、電子メールやＷｅｂサイト等からテキスト情報を取得する。
　入力部６は、ユーザによって、操作キー、操作ボタン、タッチパネル等を介して入力された入力信号を取得する。ユーザは、この入力部６を介して、各種操作を行なうことができる。

　辞書記憶部７は、入力部６を介して予め設定された、テキスト読み上げ「否」の発信元リスト（図３参照）やＮＧワード辞書（図示せず）を保持している。
　表示部８は、ディスプレイ等からなり、後述する制御部１０からの指示にしたがって、ナビゲーション情報等の案内のほか、電子メールやＷｅｂサイトからの情報をテキスト表示したり、ユーザに対して表示による報知や情報提供などを行う。
　音声出力部９は、スピーカ等からなり、後述する制御部１０からの指示にしたがって、ナビゲーション情報等の案内のほか、電子メールやＷｅｂサイトからの情報を音声により読み上げる。

　制御部１０は、ＣＰＵ等による演算処理など各種制御を行うものであり、一般的なナビゲーション装置の機能制御のほか、ＴＴＳ機能（音声読み上げ機能）を備えている。すなわち、車両情報取得部１、オーディオ情報取得部２、アナログ信号取得部３、同乗者情報取得部４、テキスト情報取得部５および入力部６からの情報を用いて、辞書記憶部７を参照しながら様々な条件を判断し、それに基づいて音声出力（テキスト読み上げ）の可否およびその出力タイミングを判断して、表示部８や音声出力部９に対して出力の指示を行う。具体的には、図２に示すフローチャートを用いて説明する。

　図２は、実施の形態１による音声出力装置の処理を示すフローチャートである。
　まず初めに、テキスト情報取得部５が、電子メール受信、ＳＭＳ（Ｓｈｏｒｔ　Ｍｅｓｓａｇｅ　Ｓｅｒｖｉｃｅ）、ＳＮＳ（Ｓｏｃｉａｌ　Ｎｅｔｗｏｒｋ　Ｓｅｒｖｉｃｅ）、Ｗｅｂ閲覧等により、文字（テキスト）を読み上げるトリガとなるテキスト情報を受け取ると（ステップＳＴ１のＹＥＳの場合）、制御部１０が、そのテキスト情報について音声出力の可否判断を行う（ステップＳＴ２～ＳＴ４）。

　音声出力の可否判断としては、最初に、同乗者情報取得部４により取得された同乗者の有無を判断し、同乗者ありの場合（ステップＳＴ２のＹＥＳの場合）には、それらの情報の発信元を判断する（ステップＳＴ３）。発信元とは、文字（テキスト）を読み上げるトリガとなるテキスト情報が、電子メール、ＳＭＳ、ＳＮＳなどの場合には、その文章を作成した発信者の名前、メール・アドレス、電話番号などであり、Ｗｅｂ閲覧の場合には、そのＷｅｂサイトのＵＲＬなどである。

　図３は、読み上げ「否」の発信元リストの一例である。この図３に示すように、同乗者がいる場合には読み上げて欲しくない、電子メール、ＳＭＳ、ＳＮＳ、Ｗｅｂ閲覧等の発信元について、ユーザが予め入力部６を介して設定することにより、辞書記憶部７に、読み上げ「否」発信元リストが記憶される。そして、ステップＳＴ３において、制御部１０が辞書記憶部７に記憶されている読み上げ「否」発信元リストを参照しながら、文字（テキスト）を読み上げるトリガとなるテキスト情報の発信元が、図３に示すような読み上げ「否」発信元リストとして記憶されている発信元に含まれているか否かを判断する。

　ここで、テキスト情報取得部５が取得したテキスト情報の発信元が読み上げ「否」発信元リストに記憶されている発信元に含まれていた場合（ステップＳＴ３のＮＯの場合）には、読み上げのための音声を生成することなく、処理を終了する。一方、読み上げ「否」発信元リストに記憶されている発信元ではなかった場合、すなわち、発信元がＯＫであった場合（ステップＳＴ３のＹＥＳの場合）には、さらに、その文字（テキスト）の中にＮＧワードが含まれていないかどうかを判断する（ステップＳＴ４）。ＮＧワードとは、同乗者がいる場合に読み上げて欲しくないキーワードのことであり、例えば「好き」、「内緒」、「秘密」など、ユーザが予め入力部６を介して設定することにより、ＮＧワードリスト（図示せず）として辞書記憶部７に記憶される。

　そして、テキスト情報の中にＮＧワードリストに記憶されているＮＧワードが含まれていた場合（ステップＳＴ４のＮＯの場合）には、読み上げのための音声を生成することなく、処理を終了する。一方、ＮＧワードが含まれていなかった場合（ステップＳＴ４のＹＥＳの場合）には、制御部１０が、さらにステップＳＴ５以降の処理を行って、音声出力部９に対してテキスト情報を音声により読み上げる指示を行う。

　このように、ＴＴＳ機能（音声読み上げ機能）を利用するか否かを予め設定して出力制御を行うだけでなく、同乗者の有無と、文章（テキスト）の発信元や内容とに基づいて音声出力の可否を判断することにより、運転中の運転者のプライバシーを保護して運転者にとって望ましい状態で情報伝達を実現することができる。
　なお、ここでは、発信元のチェック（ステップＳＴ３）とＮＧワードのチェック（ステップＳＴ４）とを両方行うものとして説明したが、これについてはどちらか一方であってもよい。ただし、両方行った方がより確実にプライバシーを保護することができる。

　この際、取得したテキスト情報の発信元が読み上げ「否」発信元リストに記憶されている発信元に含まれていた場合（ステップＳＴ３のＮＯの場合）やテキストにＮＧワードが含まれていた場合（ステップＳＴ４のＮＯの場合）には、発信元がＯＫでなかったからテキスト読み上げが行われなかった電子メール等を受け取ったという事実や、ＮＧワードが含まれていたためにテキスト読み上げが行われなかった電子メール等を受け取ったという事実に運転者が気づくことができるよう、例えば表示部８に何らかの文字やマークを表示したり、それらを点灯または点滅させるような表示を行うようにしてもよい。

　一方、音声出力を行う場合には、予め設定された音声により読み上げることが一般的であるが、運転者に違和感なく伝えるために、読み上げる音声の種類の選択を行う（ステップＳＴ５）。読み上げる音声としては、予め設定された固定音声（男性の声、女性の声などの固定の合成音声）のほか、録音された音声に基づいて生成された音声、ラジオ／テレビやオーディオ視聴中には再生中の音声に基づいて生成された音声、発信元の個人情報（年齢／性別、住所など）に基づいて男性／女性／大人／子供／方言などを考慮して生成された音声など、種々のものが可能である。

　そこで、発信者の音声が予め録音されている場合にはその録音された音声に基づいて生成された音声、録音されていない場合には発信元の個人情報に基づいて生成された音声、ラジオ／テレビ／オーディオ視聴中にはその再生中の音声に基づいて生成された音声、などのように、条件に基づいて読み上げる音声の選択が行われる。なお、条件が重なる場合の優先順位も予め設定されているものとする。

　これにより、実際に電子メール等を作成した発信者の音声により読み上げが行われたり、その発信者の個人情報に基づく音声により読み上げが行われたりするため、運転者にとって違和感がないという効果や、ラジオ／テレビ／オーディオ視聴中にＴＴＳ機能が実行されたことを同乗者に気付かれないで済むという効果がある。
　また、緊急時の情報伝達を目的とした音声の場合には、最も聞き取りやすい音声を選択するとともに、音楽等の出力を制止するなどの制御も行うようにしてもよい。

　次に、読み上げる文章（テキスト）の内容を判断して、音声の調整を行う（ステップＳＴ６）。これは例えば、絵文字や顔文字を含む電子メールを読み上げる場合には、その絵文字や顔文字に基づいて、明るい感情であることを表すように高い音声にしたり、暗い感情であることを表すように低い音声にしたり、などといった調整や、他国語の文章（テキスト）の場合にはゆっくり読み上げるなどの読み上げスピードの調整や、母国語に変換して読み上げるなどといった調整である。これにより、より違和感がなく聞き取りやすい音声を出力することができる。

　そして、音声出力のタイミングがＯＫか否かを判断する（ステップＳＴ７）。これは、運転者の安全や、快適に聞き取ることができる状態であるかを考慮して、読み上げのタイミングを判断するものである。運転者の安全を考慮して読み上げのタイミングを判断する場合には、例えば、車両情報取得部１が取得した車両の速度、ステアリング状態、パーキング状態、ブレーキ状態、ウィンドウ状態など、各種車両情報等に基づいて、運転者が運転に注力すべきタイミングか否かを判断する。そして、運転に注力すべきタイミングの時（ステップＳＴ７のＮＯの場合）には強制的に読み上げを行わずに処理を終了する。

　なお、運転に注力すべきタイミングとは、例えば、ギアチェンジ中、エンジン回転数が高く車両が加速中と判断できる場合、ブレーキを踏んでいる状態、ステアリング状態からカーブを曲がっている最中であると判断できる場合など、である。また逆に、音声出力が可能なタイミングとは、例えば、ギアチェンジがなく回転数が安定している状態、ステアリング状態から直進中であると判断できる場合など、である。

　また、快適に聞き取ることができる状態であるかを考慮して読み上げのタイミングを判断する場合には、例えば、オーディオ情報取得部２が取得したＣＤ再生中の楽曲のトラック間や、アナログ信号取得部３が取得したテレビ／ラジオの楽曲や音声の合間であれば、音声出力のタイミングＯＫと判断し、それ以外の場合には、ＯＫではないと判断する。そして、楽曲等の合間ではない場合（ステップＳＴ７のＮＯの場合）には強制的に読み上げを行わずに処理を終了する。

　この際、音声出力のタイミングがＯＫでないと判断された場合（ステップＳＴ７のＮＯの場合）には、タイミングがＯＫでなかったためにテキスト読み上げが行われなかった音声が存在することに、運転者が気づくことができるよう、例えば表示部８に何らかの文字やマークを表示したり、それらを点灯または点滅させるような表示を行うようにしてもよい。

　なお、上記では、音声出力のタイミングがＯＫでないと判断された場合（ステップＳＴ７のＮＯの場合）には、強制的に処理を終了するものとして説明したが、パーキング時やサイドブレーキを引く等の音声出力が可能なタイミングになるまで待ってから、または、楽曲等の合間になるまで待ってから、読み上げを行うようにしてもよい。

　そして、音声出力のタイミングがＯＫの場合（ステップＳＴ７のＹＥＳの場合）には、スピーカ等の音声出力部９により、音声によるテキスト読み上げを行う（ステップＳＴ８）。なお、音声の出力先は、車内のスピーカだけでなく、車載機器と接続が可能な出力機器（例えば、ハンズフリー・ヘッドセットやワイヤレス・ヘッドフォン（Ｗｉｒｅｌｅｓｓ　Ｈｅａｄｐｈｏｎｅ）など）を選択可能である。これにより、運転者に対して、より安全で快適な情報伝達を行うことができる。

　以上のように、この実施の形態１によれば、今後、車載機器でスタンダードになると思われるコネクティビティ機能やスマートフォンとの連携等により、車外から受信する大容量の情報について、プライバシーを守りつつ、安全かつ快適に運転中の運転者へ情報伝達することができる。

　また、以上の実施の形態では、車載機器に搭載される音声出力装置として説明したが、この発明の音声出力装置は、車両用のナビゲーション装置等、車両への持ち込みが可能な装置に搭載されるものであってもよく、車両用の装置であれば、どのような形態のものにも適用することができる。

　なお、本願発明はその発明の範囲内において、実施の形態の任意の構成要素の変形、もしくは実施の形態の任意の構成要素の省略が可能である。

　この発明の音声出力装置は、車載機器や車両用のナビゲーション装置等に搭載して適用することができる。

　１　車両情報取得部、２　オーディオ情報取得部、３　アナログ信号取得部、４　同乗者情報取得部、５　テキスト情報取得部、６　入力部、７　辞書記憶部、８　表示部、９　音声出力部、１０　制御部、１１　車両状態取得部。

Claims

　車両用の機器に搭載される音声出力装置において、
　同乗者の有無を取得する同乗者情報取得部と、
　外部からのテキスト情報を取得するテキスト情報取得部と、
　前記テキスト情報取得部により取得されたテキスト情報を音声により読み上げる指示を行う制御部と、
　前記音声による読み上げ「否」の発信元、または、読み上げ「否」のキーワードを記憶する辞書記憶部と、
　前記制御部からの指示にしたがって前記テキスト情報を音声により読み上げる音声出力部と、を備え、
　前記制御部は、前記同乗者情報取得部による取得結果が同乗者ありの場合に、前記テキスト情報取得部により取得されたテキスト情報の発信元が前記辞書記憶部に記憶されている読み上げ「否」の発信元に含まれている、または、前記テキスト情報取得部により取得されたテキスト情報の中に前記辞書記憶部に記憶されている読み上げ「否」のキーワードが含まれている場合には、前記音声出力部に対して前記テキスト情報を音声により読み上げる指示を行わずに処理を終了する
　ことを特徴とする音声出力装置。
　車両状態を取得する車両情報取得部をさらに備え、
　前記制御部は、
　前記同乗者情報取得部による取得結果が同乗者なしの場合、
　または、
　同乗者ありの場合であって、前記テキスト情報取得部により取得されたテキスト情報の発信元が前記辞書記憶部に記憶されている読み上げ「否」の発信元に含まれておらず、前記テキスト情報取得部により取得されたテキスト情報の中に前記辞書記憶部に記憶されている読み上げ「否」のキーワードが含まれていない場合に、
　前記車両情報取得部により取得された車両状態が運転者が運転に注力すべき状態であると判断した場合には、前記音声出力部に対して前記テキスト情報を音声により読み上げる指示を行わずに処理を終了する
　ことを特徴とする請求項１記載の音声出力装置。
　車両状態を取得する車両情報取得部をさらに備え、
　前記制御部は、
　前記同乗者情報取得部による取得結果が同乗者なしの場合、
　または、
　同乗者ありの場合であって、前記テキスト情報取得部により取得されたテキスト情報の発信元が前記辞書記憶部に記憶されている読み上げ「否」の発信元に含まれておらず、前記テキスト情報取得部により取得されたテキスト情報の中に前記辞書記憶部に記憶されている読み上げ「否」のキーワードが含まれていない場合に、
　前記車両情報取得部により取得された車両状態が運転者が運転に注力すべき状態であると判断した場合には、前記車両状態が運転者が運転に注力すべき状態でなくなるまで待ってから、前記音声出力部に対して前記テキスト情報を音声により読み上げる指示を行う
　ことを特徴とする請求項１記載の音声出力装置。