WO2014049719A1 - 音声出力装置 - Google Patents

音声出力装置 Download PDF

Info

Publication number
WO2014049719A1
WO2014049719A1 PCT/JP2012/074709 JP2012074709W WO2014049719A1 WO 2014049719 A1 WO2014049719 A1 WO 2014049719A1 JP 2012074709 W JP2012074709 W JP 2012074709W WO 2014049719 A1 WO2014049719 A1 WO 2014049719A1
Authority
WO
WIPO (PCT)
Prior art keywords
text information
acquisition unit
voice
vehicle
unit
Prior art date
Application number
PCT/JP2012/074709
Other languages
English (en)
French (fr)
Inventor
丈司 京本
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to PCT/JP2012/074709 priority Critical patent/WO2014049719A1/ja
Priority to JP2014537898A priority patent/JPWO2014049719A1/ja
Publication of WO2014049719A1 publication Critical patent/WO2014049719A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3626Details of the output of route guidance instructions
    • G01C21/3629Guidance using speech or audio output, e.g. text-to-speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Definitions

  • This invention relates to an audio output device having a function of reading out characters (text) by voice.
  • a conventional general TTS (Text to Speech) function is a method in which characters (text) are read out by a synthesized voice set in advance, and may be installed in a multifunctional car multimedia device in recent years. It is done.
  • the conventional general TTS function does not take into account the driving state of the vehicle and the driving situation of the driver, and is read out unconditionally even during high speed movement, curve, and rough road driving. There was a problem of distracting attention and that it could cause accidents due to complicated operations, and the driver's safety was not considered.
  • Patent Document 1 includes a vehicle riding state, a vehicle running state, a vehicle accessory operation state, a weather state, a driver driving state, a vehicle position, and the like. Accordingly, a car navigation device capable of ensuring driving safety by notifying the driver in an appropriate notification form is disclosed, and according to the above conditions, for example, a function of reading a mail is read out. It is described that it has.
  • Patent Document 2 in an information communication device that provides information such as e-mail, news, weather, traffic information, etc., depending on the presence or absence of a passenger, the display of the contents of the mail is displayed as only the incoming mail information. It is disclosed that reading can be prohibited and output can be limited depending on who the passenger is.
  • An object of the present invention is to provide an audio output device capable of automatically determining whether or not (text) audio output is possible and performing reading.
  • the present invention provides a passenger information acquisition unit for acquiring presence / absence of a passenger and a text information acquisition unit for acquiring external text information in an audio output device mounted on a vehicle device.
  • a control unit that instructs the text information acquired by the text information acquisition unit to be read out by voice; a dictionary storage unit that stores a source of the read-out “no” by the voice or a keyword of “no” to be read out;
  • a voice output unit that reads out the text information by voice in accordance with an instruction from the control unit, wherein the control unit is a case where an acquisition result by the passenger information acquisition unit is a passenger, and the text information
  • the source of the text information acquired by the acquisition unit is included in the source of the read-out “No” stored in the dictionary storage unit, When the text information acquired by the text information acquisition unit includes the keyword “No” read out stored in the dictionary storage unit, the text information is sent to the voice output unit. The processing is terminated without giving an instruction to read out by voice.
  • the voice output device of the present invention it is automatically determined whether or not a voice output of a sentence (text) is possible based on not only various conditions in the vehicle (vehicle state) but also the source of the text information from the outside and its contents. Therefore, the privacy of the driver during driving can be protected and information transmission can be realized safely and in a desirable state for the driver.
  • FIG. 2 is a block diagram illustrating an example of an internal configuration of the audio output device according to Embodiment 1.
  • FIG. 3 is a flowchart illustrating processing of the audio output device according to Embodiment 1. It is an example of a transmission source list of reading “No”.
  • FIG. 1 is a block diagram showing an example of the internal configuration of a sound output apparatus according to Embodiment 1 of the present invention.
  • This audio output device is mounted on an in-vehicle device, and includes a vehicle information acquisition unit 1, an audio information acquisition unit 2, an analog signal acquisition unit 3, a passenger information acquisition unit 4, a text information acquisition unit 5, and an input unit. 6, the dictionary memory
  • the vehicle information acquisition unit 1 acquires various types of vehicle information such as a vehicle speed, a steering state, a parking state, a brake state, a window state, and the like based on, for example, a CAN (Controller Area Network) signal from the vehicle.
  • the audio information acquisition unit 2 acquires sound source information from an audio device such as a CD or a DVD.
  • the analog signal acquisition unit 3 acquires an analog signal from FM / AM or the like.
  • the vehicle information acquisition unit 1, the audio information acquisition unit 2, and the analog signal acquisition unit 3 constitute a vehicle state acquisition unit 11. That is, the vehicle state acquisition unit 11 has various vehicle conditions such as various vehicle information, sound source information from audio equipment, analog signals from FM / AM, and the like, such as a running state of the vehicle and a noise state in the vehicle. Is something to get.
  • the passenger information acquisition unit 4 acquires the presence / absence information of a passenger detected by a sensor such as a load sensor or a camera built in the back of the seat or the seat.
  • the text information acquisition unit 5 acquires text information from an e-mail, a website, or the like via the Internet.
  • the input unit 6 acquires an input signal input by a user via an operation key, an operation button, a touch panel, or the like. The user can perform various operations via the input unit 6.
  • the dictionary storage unit 7 holds a source list (see FIG. 3) of text reading “No” and an NG word dictionary (not shown) set in advance via the input unit 6.
  • the display unit 8 is composed of a display or the like, and in accordance with an instruction from the control unit 10 to be described later, in addition to guidance such as navigation information, information from an e-mail or a website is displayed in text, or notification is displayed to the user. And provide information.
  • the voice output unit 9 is composed of a speaker or the like, and reads out information from an e-mail or a website by voice according to instructions from the control unit 10 to be described later, in addition to guidance such as navigation information.
  • the control unit 10 performs various controls such as arithmetic processing by a CPU or the like, and has a TTS function (speech reading function) in addition to a function control of a general navigation device. That is, the dictionary storage unit 7 is referred to using information from the vehicle information acquisition unit 1, the audio information acquisition unit 2, the analog signal acquisition unit 3, the passenger information acquisition unit 4, the text information acquisition unit 5, and the input unit 6. However, various conditions are determined, and based on the determination, whether voice output (text reading) is possible and its output timing are determined, and the display unit 8 and the voice output unit 9 are instructed to output. Specifically, this will be described with reference to the flowchart shown in FIG.
  • FIG. 2 is a flowchart showing processing of the audio output device according to the first embodiment.
  • the text information acquisition unit 5 receives text information serving as a trigger for reading a character (text) by e-mail reception, SMS (Short Message Service), SNS (Social Network Service), Web browsing, or the like (Step S1).
  • SMS Short Message Service
  • SNS Social Network Service
  • Web browsing or the like.
  • the control unit 10 determines whether or not voice output is possible for the text information (steps ST2 to ST4).
  • the presence / absence of a passenger acquired by the passenger information acquisition unit 4 is determined. If there is a passenger (in the case of YES in step ST2), the transmission of the information is performed. The origin is determined (step ST3).
  • the text information that triggers reading a character is an email, SMS, SNS, etc.
  • the sender is the name, email address, telephone number, etc. of the sender who created the sentence. In the case of Web browsing, it is the URL of the Web site.
  • FIG. 3 is an example of a sender list of “No” to be read out.
  • the dictionary is set by the user through the input unit 6 in advance for the sender of e-mail, SMS, SNS, Web browsing, etc. that are not desired to be read out when there is a passenger.
  • the storage unit 7 stores a read-out “No” sender list.
  • step ST3 the source of the text information serving as a trigger for reading out a character (text) while the control unit 10 refers to the reading “no” source list stored in the dictionary storage unit 7 is shown in FIG. It is determined whether or not it is included in the senders stored as the “no” reading source list as shown.
  • the text is read out.
  • the processing is terminated without generating a sound for the purpose.
  • the sender is not stored in the read-out “No” sender list, that is, if the sender is OK (YES in step ST3), the character (text) is further updated. It is determined whether or not an NG word is included therein (step ST4).
  • the NG word is a keyword that is not desired to be read out when there is a passenger. For example, “NG”, “secret”, “secret”, etc. are set by the user through the input unit 6 in advance. It is stored in the dictionary storage unit 7 as a word list (not shown).
  • step ST4 If the NG word stored in the NG word list is included in the text information (in the case of NO in step ST4), the process ends without generating a voice for reading. On the other hand, when the NG word is not included (in the case of YES in step ST4), the control unit 10 further performs the processing after step ST5 and reads out the text information to the voice output unit 9 by voice. Give instructions.
  • Voices to be read include preset fixed voices (fixed synthesized voices such as male voices and female voices), voices generated based on recorded voices, while watching radio / TV and audio.
  • Various sounds such as voices generated based on the voice being played, voices generated considering the male / female / adult / child / dialect, etc. based on the personal information (age / sex, address, etc.) of the sender Things are possible.
  • a voice to be read out is selected based on conditions such as a voice generated based on the voice being played back. It is assumed that the priority order when the conditions overlap is also set in advance.
  • the content of the text (text) to be read out is judged, and the sound is adjusted (step ST6).
  • the voice may be raised to indicate a bright emotion or a dark emotion Adjustments such as low speech, adjustments of reading speed such as reading slowly in the case of sentences in other languages (text), adjustments such as reading out by converting to the native language, etc. As a result, it is possible to output a voice that is more comfortable and easy to hear.
  • step ST7 it is determined whether or not the audio output timing is OK. This is to determine the timing of reading in consideration of the driver's safety and whether it can be heard comfortably.
  • the vehicle information acquisition unit 1 includes various vehicle information such as the vehicle speed, the steering state, the parking state, the brake state, and the window state. Based on this, it is determined whether or not it is time for the driver to focus on driving. Then, when it is time to focus on driving (in the case of NO in step ST7), the process is terminated without forcibly reading out.
  • the timing to focus on driving is, for example, when the engine speed is high and it can be determined that the vehicle is accelerating during a gear change, when the brake is stepped on, or when turning a curve from the steering state Such as when it can be determined.
  • the timing at which audio output is possible is, for example, when there is no gear change and the rotational speed is stable, or when it can be determined that the vehicle is traveling straight from the steering state.
  • the reading timing is determined in consideration of whether or not it can be heard comfortably, for example, between the tracks of the music being reproduced by the audio information acquisition unit 2 or the analog signal acquisition unit If 3 is between the acquired TV / radio music and audio, it is determined that the audio output timing is OK; otherwise, it is determined that it is not OK. Then, when it is not in the interval of music or the like (in the case of NO in step ST7), the process is terminated without forcibly reading out.
  • step ST7 if it is determined that the voice output timing is not OK (in the case of NO in step ST7), there is a voice that has not been read out because the timing is not OK.
  • some characters or marks may be displayed on the display unit 8 or may be displayed so as to light or blink.
  • the process is forcibly terminated when it is determined that the sound output timing is not OK (in the case of NO in step ST7). You may make it read aloud after waiting until it becomes the timing which can output audio
  • the voice output unit 9 such as a speaker reads out text by voice (step ST8).
  • the output destination of the audio can be an output device (for example, a hands-free headset or a wireless headphone) that can be connected to an in-vehicle device as well as a speaker in the vehicle. Thereby, safer and more comfortable information transmission can be performed to the driver.
  • the first embodiment it is possible to secure a large amount of information received from outside the vehicle while protecting privacy by using a connectivity function that is expected to become a standard for in-vehicle devices or in cooperation with a smartphone.
  • information can be transmitted to a driver who is driving comfortably.
  • the audio output device mounted on the vehicle-mounted device has been described.
  • the audio output device of the present invention is mounted on a device that can be brought into the vehicle, such as a navigation device for a vehicle. Any device can be applied as long as it is a vehicle device.
  • any component of the embodiment can be modified or any component of the embodiment can be omitted within the scope of the invention.
  • the audio output device of the present invention can be applied by being mounted on an in-vehicle device or a vehicle navigation device.
  • 1 vehicle information acquisition unit 2 audio information acquisition unit, 3 analog signal acquisition unit, 4 passenger information acquisition unit, 5 text information acquisition unit, 6 input unit, 7 dictionary storage unit, 8 display unit, 9 audio output unit, 10 Control unit, 11 vehicle state acquisition unit.

Landscapes

  • Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

 この発明の音声出力装置によれば、車内の様々な条件(車両状態)だけではなく、外部からのテキスト情報の発信元やその内容に基づいて、文章(テキスト)の音声出力可否を自動判別して読み上げを行うようにしたので、運転中の運転者のプライバシーを保護して運転者にとって望ましい状態で、かつ、安全に、情報伝達を実現することができる。

Description

音声出力装置
 この発明は、文字(テキスト)を音声で読み上げる機能を備えた音声出力装置に関するものである。
 従来の一般的なTTS(Text to Speech)機能は、文字(テキスト)が予め設定された合成音声で読み上げられるものであり、近年の多機能化されるカーマルチメディア機器に搭載されることが考えられる。
 しかし、従来の一般的なTTS機能は、車両の走行状態や運転者の運転状況を考慮しておらず、高速移動中やカーブ、悪路走行中にも無条件に読み上げられるため、運転者の注意を散漫にさせ、また、複雑な操作により事故の原因になりかねないものであり、運転者の安全について配慮されていない、という問題があった。
 このような問題を解決するために、例えば特許文献1には、車両の乗車状態、車両の走行状態、車両の付属機器の操作状態、天候の状態、運転者の運転状態、車両の位置等に応じて、運転者に対して適切な報知形態で報知することにより、運転の安全性を確保することが可能なカーナビゲーション装置が開示されており、上記の条件にしたがって、例えばメールを読み上げる機能を有することが記載されている。
 また、例えば特許文献2には、電子メール、ニュース、天気、交通情報等の情報を提供する情報通信装置において、同乗者の有無により、メールの着信情報のみの表示として、メールの内容の表示や読み上げは禁止したり、同乗者が誰であるかに応じて、出力に制限をかけたりすることができることが開示されている。
特開2001-141475号公報 特開2004-213175号公報
 しかしながら、例えば特許文献1,2のような従来の装置では、同乗者の有無や車両の走行状態等にしたがって、メール等の読み上げを行うか否かを決定しているだけであるが、実際にTTS機能を使用するユーザにとっては、メール等の文章の読み上げを行って欲しいか否かは、そのメールの発信元や、メールの内容によることが多い。すなわち、従来の装置では、メールの発信元やメールの内容については考慮されておらず、必ずしもユーザにとって望ましい状態で読み上げが行われるわけではない、という課題があった。
 この発明は、上記のような課題を解決するためになされたものであり、車内の様々な条件(車両状態)だけではなく、外部からのテキスト情報の発信元やその内容に基づいて、文章(テキスト)の音声出力可否を自動判別して読み上げを行うことが可能な音声出力装置を提供することを目的とする。
 上記目的を達成するため、この発明は、車両用の機器に搭載される音声出力装置において、同乗者の有無を取得する同乗者情報取得部と、外部からのテキスト情報を取得するテキスト情報取得部と、前記テキスト情報取得部により取得されたテキスト情報を音声により読み上げる指示を行う制御部と、前記音声による読み上げ「否」の発信元、または、読み上げ「否」のキーワードを記憶する辞書記憶部と、前記制御部からの指示にしたがって前記テキスト情報を音声により読み上げる音声出力部とを備え、前記制御部は、前記同乗者情報取得部による取得結果が同乗者ありの場合であって、前記テキスト情報取得部により取得されたテキスト情報の発信元が前記辞書記憶部に記憶されている読み上げ「否」の発信元に含まれている、または、前記テキスト情報取得部により取得されたテキスト情報の中に前記辞書記憶部に記憶されている読み上げ「否」のキーワードが含まれている場合には、前記音声出力部に対して前記テキスト情報を音声により読み上げる指示を行わずに処理を終了することを特徴とする。
 この発明の音声出力装置によれば、車内の様々な条件(車両状態)だけではなく、外部からのテキスト情報の発信元やその内容に基づいて、文章(テキスト)の音声出力可否を自動判別して読み上げを行うようにしたので、運転中の運転者のプライバシーを保護して運転者にとって望ましい状態で、かつ、安全に、情報伝達を実現することができる。
実施の形態1による音声出力装置の内部構成の一例を示すブロック図である。 実施の形態1による音声出力装置の処理を示すフローチャートである。 読み上げ「否」の発信元リストの一例である。
 以下、この発明の実施の形態について、図面を参照しながら詳細に説明する。
実施の形態1.
 図1は、この発明の実施の形態1による音声出力装置の内部構成の一例を示すブロック図である。この音声出力装置は、車載装置に搭載されているものであり、車両情報取得部1、オーディオ情報取得部2、アナログ信号取得部3、同乗者情報取得部4、テキスト情報取得部5、入力部6、辞書記憶部7、表示部8、音声出力部9および制御部10を備えている。そして、テキスト情報取得部5により取得された外部からのテキスト情報を、運転中の運転者が表示部8等を見て確認する必要がなく、運転者に対して安全に、情報伝達を実現するものである。
 車両情報取得部1は、例えば車両からのCAN(Controller Area Network)信号等により、車両の速度、ステアリング状態、パーキング状態、ブレーキ状態、ウィンドウ状態など、各種車両情報を取得する。
 オーディオ情報取得部2は、CDやDVD等のオーディオ機器からの音源情報などを取得する。
 アナログ信号取得部3は、FM/AM等からのアナログ信号を取得する。
 また、これら車両情報取得部1、オーディオ情報取得部2、アナログ信号取得部3が、車両状態取得部11を構成する。
 すなわち、車両状態取得部11は、各種車両情報、オーディオ機器からの音源情報、FM/AM等からのアナログ信号など、車両の走行状態や車内の騒音状態など、車内の様々な条件である車両状態を取得するものである。
 同乗者情報取得部4は、座席の背面や座面に内蔵された荷重センサやカメラ等のセンサにより検出された同乗者の有無情報を取得する。
 テキスト情報取得部5は、インターネットを介して、電子メールやWebサイト等からテキスト情報を取得する。
 入力部6は、ユーザによって、操作キー、操作ボタン、タッチパネル等を介して入力された入力信号を取得する。ユーザは、この入力部6を介して、各種操作を行なうことができる。
 辞書記憶部7は、入力部6を介して予め設定された、テキスト読み上げ「否」の発信元リスト(図3参照)やNGワード辞書(図示せず)を保持している。
 表示部8は、ディスプレイ等からなり、後述する制御部10からの指示にしたがって、ナビゲーション情報等の案内のほか、電子メールやWebサイトからの情報をテキスト表示したり、ユーザに対して表示による報知や情報提供などを行う。
 音声出力部9は、スピーカ等からなり、後述する制御部10からの指示にしたがって、ナビゲーション情報等の案内のほか、電子メールやWebサイトからの情報を音声により読み上げる。
 制御部10は、CPU等による演算処理など各種制御を行うものであり、一般的なナビゲーション装置の機能制御のほか、TTS機能(音声読み上げ機能)を備えている。すなわち、車両情報取得部1、オーディオ情報取得部2、アナログ信号取得部3、同乗者情報取得部4、テキスト情報取得部5および入力部6からの情報を用いて、辞書記憶部7を参照しながら様々な条件を判断し、それに基づいて音声出力(テキスト読み上げ)の可否およびその出力タイミングを判断して、表示部8や音声出力部9に対して出力の指示を行う。具体的には、図2に示すフローチャートを用いて説明する。
 図2は、実施の形態1による音声出力装置の処理を示すフローチャートである。
 まず初めに、テキスト情報取得部5が、電子メール受信、SMS(Short Message Service)、SNS(Social Network Service)、Web閲覧等により、文字(テキスト)を読み上げるトリガとなるテキスト情報を受け取ると(ステップST1のYESの場合)、制御部10が、そのテキスト情報について音声出力の可否判断を行う(ステップST2~ST4)。
 音声出力の可否判断としては、最初に、同乗者情報取得部4により取得された同乗者の有無を判断し、同乗者ありの場合(ステップST2のYESの場合)には、それらの情報の発信元を判断する(ステップST3)。発信元とは、文字(テキスト)を読み上げるトリガとなるテキスト情報が、電子メール、SMS、SNSなどの場合には、その文章を作成した発信者の名前、メール・アドレス、電話番号などであり、Web閲覧の場合には、そのWebサイトのURLなどである。
 図3は、読み上げ「否」の発信元リストの一例である。この図3に示すように、同乗者がいる場合には読み上げて欲しくない、電子メール、SMS、SNS、Web閲覧等の発信元について、ユーザが予め入力部6を介して設定することにより、辞書記憶部7に、読み上げ「否」発信元リストが記憶される。そして、ステップST3において、制御部10が辞書記憶部7に記憶されている読み上げ「否」発信元リストを参照しながら、文字(テキスト)を読み上げるトリガとなるテキスト情報の発信元が、図3に示すような読み上げ「否」発信元リストとして記憶されている発信元に含まれているか否かを判断する。
 ここで、テキスト情報取得部5が取得したテキスト情報の発信元が読み上げ「否」発信元リストに記憶されている発信元に含まれていた場合(ステップST3のNOの場合)には、読み上げのための音声を生成することなく、処理を終了する。一方、読み上げ「否」発信元リストに記憶されている発信元ではなかった場合、すなわち、発信元がOKであった場合(ステップST3のYESの場合)には、さらに、その文字(テキスト)の中にNGワードが含まれていないかどうかを判断する(ステップST4)。NGワードとは、同乗者がいる場合に読み上げて欲しくないキーワードのことであり、例えば「好き」、「内緒」、「秘密」など、ユーザが予め入力部6を介して設定することにより、NGワードリスト(図示せず)として辞書記憶部7に記憶される。
 そして、テキスト情報の中にNGワードリストに記憶されているNGワードが含まれていた場合(ステップST4のNOの場合)には、読み上げのための音声を生成することなく、処理を終了する。一方、NGワードが含まれていなかった場合(ステップST4のYESの場合)には、制御部10が、さらにステップST5以降の処理を行って、音声出力部9に対してテキスト情報を音声により読み上げる指示を行う。
 このように、TTS機能(音声読み上げ機能)を利用するか否かを予め設定して出力制御を行うだけでなく、同乗者の有無と、文章(テキスト)の発信元や内容とに基づいて音声出力の可否を判断することにより、運転中の運転者のプライバシーを保護して運転者にとって望ましい状態で情報伝達を実現することができる。
 なお、ここでは、発信元のチェック(ステップST3)とNGワードのチェック(ステップST4)とを両方行うものとして説明したが、これについてはどちらか一方であってもよい。ただし、両方行った方がより確実にプライバシーを保護することができる。
 この際、取得したテキスト情報の発信元が読み上げ「否」発信元リストに記憶されている発信元に含まれていた場合(ステップST3のNOの場合)やテキストにNGワードが含まれていた場合(ステップST4のNOの場合)には、発信元がOKでなかったからテキスト読み上げが行われなかった電子メール等を受け取ったという事実や、NGワードが含まれていたためにテキスト読み上げが行われなかった電子メール等を受け取ったという事実に運転者が気づくことができるよう、例えば表示部8に何らかの文字やマークを表示したり、それらを点灯または点滅させるような表示を行うようにしてもよい。
 一方、音声出力を行う場合には、予め設定された音声により読み上げることが一般的であるが、運転者に違和感なく伝えるために、読み上げる音声の種類の選択を行う(ステップST5)。読み上げる音声としては、予め設定された固定音声(男性の声、女性の声などの固定の合成音声)のほか、録音された音声に基づいて生成された音声、ラジオ/テレビやオーディオ視聴中には再生中の音声に基づいて生成された音声、発信元の個人情報(年齢/性別、住所など)に基づいて男性/女性/大人/子供/方言などを考慮して生成された音声など、種々のものが可能である。
 そこで、発信者の音声が予め録音されている場合にはその録音された音声に基づいて生成された音声、録音されていない場合には発信元の個人情報に基づいて生成された音声、ラジオ/テレビ/オーディオ視聴中にはその再生中の音声に基づいて生成された音声、などのように、条件に基づいて読み上げる音声の選択が行われる。なお、条件が重なる場合の優先順位も予め設定されているものとする。
 これにより、実際に電子メール等を作成した発信者の音声により読み上げが行われたり、その発信者の個人情報に基づく音声により読み上げが行われたりするため、運転者にとって違和感がないという効果や、ラジオ/テレビ/オーディオ視聴中にTTS機能が実行されたことを同乗者に気付かれないで済むという効果がある。
 また、緊急時の情報伝達を目的とした音声の場合には、最も聞き取りやすい音声を選択するとともに、音楽等の出力を制止するなどの制御も行うようにしてもよい。
 次に、読み上げる文章(テキスト)の内容を判断して、音声の調整を行う(ステップST6)。これは例えば、絵文字や顔文字を含む電子メールを読み上げる場合には、その絵文字や顔文字に基づいて、明るい感情であることを表すように高い音声にしたり、暗い感情であることを表すように低い音声にしたり、などといった調整や、他国語の文章(テキスト)の場合にはゆっくり読み上げるなどの読み上げスピードの調整や、母国語に変換して読み上げるなどといった調整である。これにより、より違和感がなく聞き取りやすい音声を出力することができる。
 そして、音声出力のタイミングがOKか否かを判断する(ステップST7)。これは、運転者の安全や、快適に聞き取ることができる状態であるかを考慮して、読み上げのタイミングを判断するものである。運転者の安全を考慮して読み上げのタイミングを判断する場合には、例えば、車両情報取得部1が取得した車両の速度、ステアリング状態、パーキング状態、ブレーキ状態、ウィンドウ状態など、各種車両情報等に基づいて、運転者が運転に注力すべきタイミングか否かを判断する。そして、運転に注力すべきタイミングの時(ステップST7のNOの場合)には強制的に読み上げを行わずに処理を終了する。
 なお、運転に注力すべきタイミングとは、例えば、ギアチェンジ中、エンジン回転数が高く車両が加速中と判断できる場合、ブレーキを踏んでいる状態、ステアリング状態からカーブを曲がっている最中であると判断できる場合など、である。また逆に、音声出力が可能なタイミングとは、例えば、ギアチェンジがなく回転数が安定している状態、ステアリング状態から直進中であると判断できる場合など、である。
 また、快適に聞き取ることができる状態であるかを考慮して読み上げのタイミングを判断する場合には、例えば、オーディオ情報取得部2が取得したCD再生中の楽曲のトラック間や、アナログ信号取得部3が取得したテレビ/ラジオの楽曲や音声の合間であれば、音声出力のタイミングOKと判断し、それ以外の場合には、OKではないと判断する。そして、楽曲等の合間ではない場合(ステップST7のNOの場合)には強制的に読み上げを行わずに処理を終了する。
 この際、音声出力のタイミングがOKでないと判断された場合(ステップST7のNOの場合)には、タイミングがOKでなかったためにテキスト読み上げが行われなかった音声が存在することに、運転者が気づくことができるよう、例えば表示部8に何らかの文字やマークを表示したり、それらを点灯または点滅させるような表示を行うようにしてもよい。
 なお、上記では、音声出力のタイミングがOKでないと判断された場合(ステップST7のNOの場合)には、強制的に処理を終了するものとして説明したが、パーキング時やサイドブレーキを引く等の音声出力が可能なタイミングになるまで待ってから、または、楽曲等の合間になるまで待ってから、読み上げを行うようにしてもよい。
 そして、音声出力のタイミングがOKの場合(ステップST7のYESの場合)には、スピーカ等の音声出力部9により、音声によるテキスト読み上げを行う(ステップST8)。なお、音声の出力先は、車内のスピーカだけでなく、車載機器と接続が可能な出力機器(例えば、ハンズフリー・ヘッドセットやワイヤレス・ヘッドフォン(Wireless Headphone)など)を選択可能である。これにより、運転者に対して、より安全で快適な情報伝達を行うことができる。
 以上のように、この実施の形態1によれば、今後、車載機器でスタンダードになると思われるコネクティビティ機能やスマートフォンとの連携等により、車外から受信する大容量の情報について、プライバシーを守りつつ、安全かつ快適に運転中の運転者へ情報伝達することができる。
 また、以上の実施の形態では、車載機器に搭載される音声出力装置として説明したが、この発明の音声出力装置は、車両用のナビゲーション装置等、車両への持ち込みが可能な装置に搭載されるものであってもよく、車両用の装置であれば、どのような形態のものにも適用することができる。
 なお、本願発明はその発明の範囲内において、実施の形態の任意の構成要素の変形、もしくは実施の形態の任意の構成要素の省略が可能である。
 この発明の音声出力装置は、車載機器や車両用のナビゲーション装置等に搭載して適用することができる。
 1 車両情報取得部、2 オーディオ情報取得部、3 アナログ信号取得部、4 同乗者情報取得部、5 テキスト情報取得部、6 入力部、7 辞書記憶部、8 表示部、9 音声出力部、10 制御部、11 車両状態取得部。

Claims (3)

  1.  車両用の機器に搭載される音声出力装置において、
     同乗者の有無を取得する同乗者情報取得部と、
     外部からのテキスト情報を取得するテキスト情報取得部と、
     前記テキスト情報取得部により取得されたテキスト情報を音声により読み上げる指示を行う制御部と、
     前記音声による読み上げ「否」の発信元、または、読み上げ「否」のキーワードを記憶する辞書記憶部と、
     前記制御部からの指示にしたがって前記テキスト情報を音声により読み上げる音声出力部と、を備え、
     前記制御部は、前記同乗者情報取得部による取得結果が同乗者ありの場合に、前記テキスト情報取得部により取得されたテキスト情報の発信元が前記辞書記憶部に記憶されている読み上げ「否」の発信元に含まれている、または、前記テキスト情報取得部により取得されたテキスト情報の中に前記辞書記憶部に記憶されている読み上げ「否」のキーワードが含まれている場合には、前記音声出力部に対して前記テキスト情報を音声により読み上げる指示を行わずに処理を終了する
     ことを特徴とする音声出力装置。
  2.  車両状態を取得する車両情報取得部をさらに備え、
     前記制御部は、
     前記同乗者情報取得部による取得結果が同乗者なしの場合、
     または、
     同乗者ありの場合であって、前記テキスト情報取得部により取得されたテキスト情報の発信元が前記辞書記憶部に記憶されている読み上げ「否」の発信元に含まれておらず、前記テキスト情報取得部により取得されたテキスト情報の中に前記辞書記憶部に記憶されている読み上げ「否」のキーワードが含まれていない場合に、
     前記車両情報取得部により取得された車両状態が運転者が運転に注力すべき状態であると判断した場合には、前記音声出力部に対して前記テキスト情報を音声により読み上げる指示を行わずに処理を終了する
     ことを特徴とする請求項1記載の音声出力装置。
  3.  車両状態を取得する車両情報取得部をさらに備え、
     前記制御部は、
     前記同乗者情報取得部による取得結果が同乗者なしの場合、
     または、
     同乗者ありの場合であって、前記テキスト情報取得部により取得されたテキスト情報の発信元が前記辞書記憶部に記憶されている読み上げ「否」の発信元に含まれておらず、前記テキスト情報取得部により取得されたテキスト情報の中に前記辞書記憶部に記憶されている読み上げ「否」のキーワードが含まれていない場合に、
     前記車両情報取得部により取得された車両状態が運転者が運転に注力すべき状態であると判断した場合には、前記車両状態が運転者が運転に注力すべき状態でなくなるまで待ってから、前記音声出力部に対して前記テキスト情報を音声により読み上げる指示を行う
     ことを特徴とする請求項1記載の音声出力装置。
PCT/JP2012/074709 2012-09-26 2012-09-26 音声出力装置 WO2014049719A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2012/074709 WO2014049719A1 (ja) 2012-09-26 2012-09-26 音声出力装置
JP2014537898A JPWO2014049719A1 (ja) 2012-09-26 2012-09-26 音声出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/074709 WO2014049719A1 (ja) 2012-09-26 2012-09-26 音声出力装置

Publications (1)

Publication Number Publication Date
WO2014049719A1 true WO2014049719A1 (ja) 2014-04-03

Family

ID=50387185

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/074709 WO2014049719A1 (ja) 2012-09-26 2012-09-26 音声出力装置

Country Status (2)

Country Link
JP (1) JPWO2014049719A1 (ja)
WO (1) WO2014049719A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016050964A (ja) * 2014-08-28 2016-04-11 株式会社デンソー 読上げ制御装置および通話制御装置
JP2017172985A (ja) * 2016-03-18 2017-09-28 ヤフー株式会社 端末装置、プログラム、および保険条件決定装置
JP2019200669A (ja) * 2018-05-17 2019-11-21 Necパーソナルコンピュータ株式会社 情報処理装置、プログラム及び情報処理方法
CN110972087A (zh) * 2018-10-01 2020-04-07 现代自动车株式会社 车辆及其控制方法
JP2020061658A (ja) * 2018-10-10 2020-04-16 カシオ計算機株式会社 電子機器、通知制御システム、通知制御方法及びプログラム
WO2022250419A1 (ko) * 2021-05-24 2022-12-01 삼성전자 주식회사 프라이버시에 기반한 오디오 운용 방법 및 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109487A (ja) * 1999-10-07 2001-04-20 Matsushita Electric Ind Co Ltd 電子メールの音声再生装置、その音声再生方法、及び音声再生プログラムを記録した記録媒体
JP2004213175A (ja) * 2002-12-27 2004-07-29 Toyota Motor Corp 情報通信システム
WO2006080575A1 (ja) * 2005-01-31 2006-08-03 Nec Corporation ハンズフリー機能のプライバシー保護装置
JP2010092438A (ja) * 2008-10-10 2010-04-22 Fujitsu Ten Ltd 車載装置および情報通知方法
JP2010128099A (ja) * 2008-11-26 2010-06-10 Toyota Infotechnology Center Co Ltd 車載用音声情報提供システム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009139022A1 (ja) * 2008-05-15 2009-11-19 パイオニア株式会社 音声出力装置およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109487A (ja) * 1999-10-07 2001-04-20 Matsushita Electric Ind Co Ltd 電子メールの音声再生装置、その音声再生方法、及び音声再生プログラムを記録した記録媒体
JP2004213175A (ja) * 2002-12-27 2004-07-29 Toyota Motor Corp 情報通信システム
WO2006080575A1 (ja) * 2005-01-31 2006-08-03 Nec Corporation ハンズフリー機能のプライバシー保護装置
JP2010092438A (ja) * 2008-10-10 2010-04-22 Fujitsu Ten Ltd 車載装置および情報通知方法
JP2010128099A (ja) * 2008-11-26 2010-06-10 Toyota Infotechnology Center Co Ltd 車載用音声情報提供システム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016050964A (ja) * 2014-08-28 2016-04-11 株式会社デンソー 読上げ制御装置および通話制御装置
JP2017172985A (ja) * 2016-03-18 2017-09-28 ヤフー株式会社 端末装置、プログラム、および保険条件決定装置
US10362552B2 (en) 2016-03-18 2019-07-23 Yahoo Japan Corporation Terminal device, non-transitory computer readable storage medium, and insurance condition determination device
JP2019200669A (ja) * 2018-05-17 2019-11-21 Necパーソナルコンピュータ株式会社 情報処理装置、プログラム及び情報処理方法
CN110972087A (zh) * 2018-10-01 2020-04-07 现代自动车株式会社 车辆及其控制方法
CN110972087B (zh) * 2018-10-01 2022-08-09 现代自动车株式会社 车辆及其控制方法
JP2020061658A (ja) * 2018-10-10 2020-04-16 カシオ計算機株式会社 電子機器、通知制御システム、通知制御方法及びプログラム
JP7243118B2 (ja) 2018-10-10 2023-03-22 カシオ計算機株式会社 電子機器、通知制御システム、通知制御方法及びプログラム
WO2022250419A1 (ko) * 2021-05-24 2022-12-01 삼성전자 주식회사 프라이버시에 기반한 오디오 운용 방법 및 장치

Also Published As

Publication number Publication date
JPWO2014049719A1 (ja) 2016-08-22

Similar Documents

Publication Publication Date Title
WO2014049719A1 (ja) 音声出力装置
JP6515764B2 (ja) 対話装置及び対話方法
JP5140580B2 (ja) 車両没入型通信システム
US9058705B2 (en) Communication system with personal information management and remote vehicle monitoring and control features
JP5592473B2 (ja) 携帯機器と連携して動作可能な車載機器
US20100184406A1 (en) Total Integrated Messaging
US20150350400A1 (en) Method and System for Safe Messaging While Driving
JP2013152524A (ja) 車車間通信装置
US20130078963A1 (en) Method and Apparatus for Incoming Call Filtration and Message Delivery
JP6432216B2 (ja) 読上げ制御装置
US20110065428A1 (en) Systems and methods for selecting an output modality in a mobile device
JP2016090681A (ja) 車両用音声対話装置
US8452533B2 (en) System and method for extracting a destination from voice data originating over a communication network
US20130337853A1 (en) System and method for interacting with a mobile communication device
US9167394B2 (en) In-vehicle messaging
KR101217521B1 (ko) 차량용 avn을 위한 텍스트/음성 변환 제공 방법
JP2011172059A (ja) 音声出力システム
US20230041105A1 (en) Method and system for imparting voice commands to a motor vehicle
KR20210095569A (ko) 에이전트 시스템, 서버 및 컴퓨터 판독 가능한 기록 매체
CN106888147B (zh) 一种车载即时通讯免提系统
Tchankue et al. Are mobile in-car communication systems feasible? a usability study
JP2014065554A (ja) エレベータの指差呼称復唱装置
Rosenberger The problem with hands-free dashboard cellphones
JP5584184B2 (ja) ウェブ上の個人化されたコンテンツを提供するインターネットテレマティクスサービス提供システムおよび提供方法
KR20120009189A (ko) 차량 상태 표시 시스템 및 그의 이동 단말기 상태 표시 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12885813

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014537898

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12885813

Country of ref document: EP

Kind code of ref document: A1