JPWO2017125998A1 - 音声案内制御装置及び音声案内制御方法 - Google Patents
音声案内制御装置及び音声案内制御方法 Download PDFInfo
- Publication number
- JPWO2017125998A1 JPWO2017125998A1 JP2017546924A JP2017546924A JPWO2017125998A1 JP WO2017125998 A1 JPWO2017125998 A1 JP WO2017125998A1 JP 2017546924 A JP2017546924 A JP 2017546924A JP 2017546924 A JP2017546924 A JP 2017546924A JP WO2017125998 A1 JPWO2017125998 A1 JP WO2017125998A1
- Authority
- JP
- Japan
- Prior art keywords
- time interval
- audio data
- margin value
- time
- reproduction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 26
- 238000004364 calculation method Methods 0.000 claims abstract description 90
- 238000012545 processing Methods 0.000 description 32
- 238000011156 evaluation Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 17
- 230000006870 function Effects 0.000 description 10
- 230000001186 cumulative effect Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 230000008929 regeneration Effects 0.000 description 9
- 238000011069 regeneration method Methods 0.000 description 9
- 230000004397 blinking Effects 0.000 description 6
- 210000004556 brain Anatomy 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 230000008921 facial expression Effects 0.000 description 4
- 238000003909 pattern recognition Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 102100035353 Cyclin-dependent kinase 2-associated protein 1 Human genes 0.000 description 1
- 101000710013 Homo sapiens Reversion-inducing cysteine-rich protein with Kazal motifs Proteins 0.000 description 1
- 101000661807 Homo sapiens Suppressor of tumorigenicity 14 protein Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 102100029860 Suppressor of tumorigenicity 20 protein Human genes 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 108090000237 interleukin-24 Proteins 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/09—Arrangements for giving variable traffic instructions
- G08G1/0962—Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
- G08G1/0968—Systems involving transmission of navigation instructions to the vehicle
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Child & Adolescent Psychology (AREA)
- General Health & Medical Sciences (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
- Signal Processing (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- General Physics & Mathematics (AREA)
- Navigation (AREA)
- Traffic Control Systems (AREA)
Abstract
Description
実施の形態1.
図1は、本発明の実施の形態1に係る音声案内制御装置及び車載情報システムの要部を示すブロック図である。図2は、本発明の実施の形態1に係る音声案内制御装置の要部を示すハードウェア構成図である。図3は、本発明の実施の形態1に係る音声案内制御装置の要部を示す他のハードウェア構成図である。図1〜図3を参照して、実施の形態1の音声案内制御装置100について、車載情報システム200を制御対象とした例を中心に説明する。
車載情報機器21は、GPS(Global Positioning System)受信機22が図示しないGPS衛星から受信したGPS信号を用いて、車載情報システム200を搭載した車両(以下「自車両」という。)の現在位置を算出するものである。車載情報機器21は、地図情報記憶部23に記憶された地図情報を用いて、自車両の現在位置から、操作入力装置24の操作により設定された目的地までの走行経路を検索するものである。車載情報機器21は、検索結果の中から案内対象の走行経路を選択し、当該走行経路を案内する各種画像データを表示装置25に出力するとともに、当該走行経路を案内する各種音声データを音声出力装置26に出力するものである。
自車両には、ユーザを含む自車両の搭乗者が発した音声の入力を受け付けるマイク1と、ユーザの上半身又は全身を撮影するカメラ2とが設けられている。ユーザの身体には、ユーザの脳波を検出する脳波センサ3と、ユーザの心拍を検出する心拍センサ4とが取り付けられている。
まず、ステップST1にて、余裕度値算出部13は、未来時間区間におけるユーザの余裕度値を算出する。次いで、ステップST2にて、時間制約情報取得部14は、未来時間区間にて再生対象となる音声データの時間制約情報を取得する。次いで、ステップST3にて、再生候補時間区間設定部15は、ステップST2で時間制約情報取得部14が取得した時間制約情報を用いて、未来時間区間のうちの再生候補時間区間を設定する。次いで、ステップST4にて、再生時間区間設定部16は、ステップST1で余裕度値算出部13が算出した余裕度値を用いて、ステップST3で再生候補時間区間設定部15が設定した再生候補時間区間のうちの再生時間区間を設定する。
図5は、余裕度値算出部13の詳細な動作を示すフローチャートである。まず、ステップST11にて、第1余裕度値算出部10は、マイク1の出力信号を用いて、ユーザを含む自車両の搭乗者が発した音声の特徴量を抽出する。ステップST12にて、第1余裕度値算出部10は、カメラ2の出力信号を用いて、ユーザを撮影した画像の特徴量を抽出する。ステップST13にて、第1余裕度値算出部10は、脳波センサ3の出力信号を用いて、ユーザの脳波の特徴量を抽出する。ステップST14にて、第1余裕度値算出部10は、心拍センサ4の出力信号を用いて、ユーザの心拍の特徴量を抽出する。
図7は、時間制約情報取得部14の詳細な動作を示すフローチャートである。まず、ステップST31にて、時間制約情報取得部14は、車載情報機器21から、未来時間区間Tにて再生対象となる音声データのうち、走行経路を案内する音声データの時間制約情報を取得する。以下同様に、時間制約情報取得部14は、ステップST32にて天気予報情報を案内する音声データの時間制約情報を取得し、ステップST33にて道路交通情報を案内する音声データの時間制約情報を取得し、ステップST34にてニュース情報を案内する音声データの時間制約情報を取得する。
図9は、再生候補時間区間設定部15の詳細な動作を示すフローチャートである。まず、ステップST41にて、再生候補時間区間設定部15は、時間制約情報取得部14が図7のステップST31〜ST34で取得した時間制約情報を時間制約情報取得部14から取得する。次いで、ステップST42にて、再生候補時間区間設定部15は、時間制約情報が示す各音声データの再生可能時間区間に応じて、同一の音声データを再生可能な時間区間を1つの再生候補時間区間としてまとめる処理を実行する。当該処理により、1つ又は複数の音声データごとの再生候補時間区間が設定される。
図12は、再生時間区間設定部16の詳細な動作を示すフローチャートである。まず、ステップST51にて、再生時間区間設定部16は、図9のステップST42で再生候補時間区間設定部15が設定した各再生候補時間区間における、各音声データのパスを算出する。ここで、各音声データの「パス」とは、再生候補時間区間を所定長(例えば500ms)ごとに分割してなる単位時間区間αのそれぞれにおいて、当該音声データを再生するか否かを示す特性線により与えられる。
図15は、本発明の実施の形態2に係る音声案内制御装置及び車載情報システムの要部を示すブロック図である。図15を参照して、実施の形態2の音声案内制御装置100について、車載情報システム200を制御対象とした例を中心に説明する。なお、図1に示す実施の形態1の音声案内制御装置100及び車載情報システム200と同様のブロックには同一符号を付して説明を省略する。また、実施の形態2に係る音声案内制御装置100のハードウェア構成は、実施の形態1にて図2及び図3を参照して説明したものと同様であるため、図示及び説明を省略する。
まず、ステップST61にて、余裕度値算出部13は、未来時間区間におけるユーザの余裕度値を算出する。ステップST61の詳細な処理内容は、実施の形態1で図5及び図6を参照して説明したものと同様であるため、説明を省略する。
Claims (5)
- 未来時間区間におけるユーザの余裕度値を算出する余裕度値算出部と、
前記未来時間区間にて再生対象となる複数の音声データのそれぞれについて、前記未来時間区間のうちの当該音声データを再生可能な時間区間を示す時間制約情報を取得する時間制約情報取得部と、
前記時間制約情報を用いて、前記未来時間区間のうちの前記音声データを再生する時間区間の候補である再生候補時間区間を、1つ又は複数の前記音声データごとに設定する再生候補時間区間設定部と、
前記余裕度値を用いて、前記再生候補時間区間のうちの実際に前記音声データを再生する時間区間である再生時間区間を、個々の前記音声データごとに設定する再生時間区間設定部と、
を備える音声案内制御装置。 - 前記余裕度値算出部は、
前記ユーザの状態を示す特徴量を用いて、前記未来時間区間における第1余裕度値を算出する第1余裕度値算出部と、
当該音声案内制御装置の制御対象であるシステムから得られた情報を用いて、前記未来時間区間における第2余裕度値を算出する第2余裕度値算出部と、
前記第1余裕度値と前記第2余裕度値との乗算により前記余裕度値を算出する余裕度値乗算部と、
を備えることを特徴とする請求項1記載の音声案内制御装置。 - 前記未来時間区間のうちの前記余裕度値が連続して基準値を超える時間区間である余裕継続時間区間を算出する余裕継続時間区間算出部を備え、
前記再生候補時間区間設定部は、前記余裕継続時間区間の中から前記再生候補時間区間を設定する
ことを特徴とする請求項1記載の音声案内制御装置。 - 前記再生時間区間設定部は、一部の前記音声データを再生対象から除外して、残余の前記音声データに前記再生時間区間を設定することを特徴とする請求項3記載の音声案内制御装置。
- 余裕度値算出部が、未来時間区間におけるユーザの余裕度値を算出するステップと、
時間制約情報取得部が、前記未来時間区間にて再生対象となる複数の音声データのそれぞれについて、前記未来時間区間のうちの当該音声データを再生可能な時間区間を示す時間制約情報を取得するステップと、
再生候補時間区間設定部が、前記時間制約情報を用いて、前記未来時間区間のうちの前記音声データを再生する時間区間の候補である再生候補時間区間を、1つ又は複数の前記音声データごとに設定するステップと、
再生時間区間設定部が、前記余裕度値を用いて、前記再生候補時間区間のうちの実際に前記音声データを再生する時間区間である再生時間区間を、個々の前記音声データごとに設定するステップと、
を備える音声案内制御方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/051236 WO2017125998A1 (ja) | 2016-01-18 | 2016-01-18 | 音声案内制御装置及び音声案内制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017125998A1 true JPWO2017125998A1 (ja) | 2018-01-25 |
JP6272585B2 JP6272585B2 (ja) | 2018-01-31 |
Family
ID=59361949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017546924A Active JP6272585B2 (ja) | 2016-01-18 | 2016-01-18 | 音声案内制御装置及び音声案内制御方法 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP6272585B2 (ja) |
TW (1) | TW201727592A (ja) |
WO (1) | WO2017125998A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1082653A (ja) * | 1996-09-06 | 1998-03-31 | Matsushita Electric Ind Co Ltd | ナビゲーション装置 |
WO2006070566A1 (ja) * | 2004-12-28 | 2006-07-06 | Matsushita Electric Industrial Co., Ltd. | 音声合成方法および情報提供装置 |
JP2015017856A (ja) * | 2013-07-10 | 2015-01-29 | 本田技研工業株式会社 | 情報提供装置 |
-
2016
- 2016-01-18 JP JP2017546924A patent/JP6272585B2/ja active Active
- 2016-01-18 WO PCT/JP2016/051236 patent/WO2017125998A1/ja active Application Filing
- 2016-06-04 TW TW105117711A patent/TW201727592A/zh unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1082653A (ja) * | 1996-09-06 | 1998-03-31 | Matsushita Electric Ind Co Ltd | ナビゲーション装置 |
WO2006070566A1 (ja) * | 2004-12-28 | 2006-07-06 | Matsushita Electric Industrial Co., Ltd. | 音声合成方法および情報提供装置 |
JP2015017856A (ja) * | 2013-07-10 | 2015-01-29 | 本田技研工業株式会社 | 情報提供装置 |
Also Published As
Publication number | Publication date |
---|---|
TW201727592A (zh) | 2017-08-01 |
JP6272585B2 (ja) | 2018-01-31 |
WO2017125998A1 (ja) | 2017-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5921722B2 (ja) | 音声認識装置および表示方法 | |
JP5972372B2 (ja) | 車載情報装置 | |
JP4304952B2 (ja) | 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム | |
US20140100847A1 (en) | Voice recognition device and navigation device | |
EP1691343A1 (en) | Audio device control device,audio device control method, and program | |
JP3322140B2 (ja) | 車両用音声案内装置 | |
JP5893217B2 (ja) | 音声認識装置および表示方法 | |
JP6604151B2 (ja) | 音声認識制御システム | |
JP5005491B2 (ja) | 車載機、その出力態様設定方法 | |
JP2006012081A (ja) | コンテンツ出力装置、ナビゲーション装置、コンテンツ出力プログラム、及びコンテンツ出力方法 | |
JP5181533B2 (ja) | 音声対話装置 | |
US20190241196A1 (en) | Information processing apparatus and information processing method | |
JP6272585B2 (ja) | 音声案内制御装置及び音声案内制御方法 | |
JP6691737B2 (ja) | 歌詞音声出力装置、歌詞音声出力方法、及び、プログラム | |
JP4533696B2 (ja) | 報知制御装置、報知制御システム、それらの方法、それらのプログラム、および、それらのプログラムを記録した記録媒体 | |
JP2004233676A (ja) | 対話制御装置 | |
JP6741387B2 (ja) | 音声出力装置 | |
WO2016135921A1 (ja) | 車載用音楽再生装置、音楽再生方法、及び、プログラム | |
WO2023062814A1 (ja) | 音声出力装置、音声出力方法、プログラム及び記憶媒体 | |
JP2016157082A (ja) | 再生装置、再生方法、及び、プログラム | |
WO2023073912A1 (ja) | 音声出力装置、音声出力方法、プログラム及び記憶媒体 | |
JP2016157084A (ja) | 再生装置、再生方法、及び、プログラム | |
JP2009086132A (ja) | 音声認識装置、音声認識装置を備えたナビゲーション装置、音声認識装置を備えた電子機器、音声認識方法、音声認識プログラム、および記録媒体 | |
JP2023024738A (ja) | 再生装置、再生方法、及び、プログラム | |
JP2016157088A (ja) | 楽曲再生システム、端末装置、楽曲データ提供方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170905 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20170905 |
|
TRDD | Decision of grant or rejection written | ||
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20171128 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6272585 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |