JP7192561B2 - 音声出力装置および音声出力方法 - Google Patents
音声出力装置および音声出力方法 Download PDFInfo
- Publication number
- JP7192561B2 JP7192561B2 JP2019028487A JP2019028487A JP7192561B2 JP 7192561 B2 JP7192561 B2 JP 7192561B2 JP 2019028487 A JP2019028487 A JP 2019028487A JP 2019028487 A JP2019028487 A JP 2019028487A JP 7192561 B2 JP7192561 B2 JP 7192561B2
- Authority
- JP
- Japan
- Prior art keywords
- type
- output
- reflection
- voice
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 17
- 230000005236 sound signal Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010370 hearing loss Effects 0.000 description 1
- 231100000888 hearing loss Toxicity 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Navigation (AREA)
Description
Claims (5)
- 車両の乗員の発話を取得する取得部と、
取得された前記発話が聞き返しであるか否か判定する判定部と、
前記発話が聞き返しであると判定された場合、聞き返しのタイプを分類する分類部と、
聞き返しの対象となる音声の内容にもとづいて、分類された聞き返しのタイプに応じた音声を出力する出力部と、
車室内の画像を画像認識して、眠っている可能性のある乗員を検出する画像認識部と、
を備え、
前記出力部は、聞き返しのタイプが聞き逃しを示すタイプである場合、眠っている可能性のある乗員が前記画像認識部で検出されなければ、聞き返しの対象となる音声をより大きい音量で再出力し、聞き返しのタイプが聞き逃しを示すタイプである場合、眠っている可能性のある乗員が前記画像認識部で検出されれば、音量を維持して、聞き返しの対象となる音声を再出力する、
ことを特徴とする音声出力装置。 - 聞き返しの直前に前記出力部から出力された音声にもとづいて、聞き返しの対象となる音声の内容を特定する特定部を備える、ことを特徴とする請求項1に記載の音声出力装置。
- 前記出力部は、聞き返しのタイプが音声の内容の意味を理解していないことを示すタイプである場合、聞き返しの対象となる音声の内容に関連した別の音声を出力する、ことを特徴とする請求項1または2に記載の音声出力装置。
- 前記出力部は、聞き返しのタイプが聞き取れないことを示すタイプである場合、聞き返しの対象となる音声をより大きい音量で再出力する、ことを特徴とする請求項1から3のいずれかに記載の音声出力装置。
- コンピュータが実行する音声出力方法であって、
車両の乗員の発話を取得する取得ステップと、
取得された前記発話が聞き返しであるか否か判定する判定ステップと、
前記発話が聞き返しであると判定された場合、聞き返しのタイプを分類する分類ステップと、
車室内の画像を画像認識して、眠っている可能性のある乗員を検出する画像認識ステップと、
聞き返しの対象となる音声の内容にもとづいて、分類された聞き返しのタイプに応じた音声を出力する出力ステップと、
を備え、
前記出力ステップでは、聞き返しのタイプが聞き逃しを示すタイプである場合、眠っている可能性のある乗員が前記画像認識ステップで検出されなければ、聞き返しの対象となる音声をより大きい音量で再出力し、聞き返しのタイプが聞き逃しを示すタイプである場合、眠っている可能性のある乗員が前記画像認識ステップで検出されれば、音量を維持して、聞き返しの対象となる音声を再出力する、
ことを特徴とする音声出力方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019028487A JP7192561B2 (ja) | 2019-02-20 | 2019-02-20 | 音声出力装置および音声出力方法 |
US16/718,309 US11295742B2 (en) | 2019-02-20 | 2019-12-18 | Voice output apparatus and voice output method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019028487A JP7192561B2 (ja) | 2019-02-20 | 2019-02-20 | 音声出力装置および音声出力方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020134328A JP2020134328A (ja) | 2020-08-31 |
JP7192561B2 true JP7192561B2 (ja) | 2022-12-20 |
Family
ID=72042387
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019028487A Active JP7192561B2 (ja) | 2019-02-20 | 2019-02-20 | 音声出力装置および音声出力方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11295742B2 (ja) |
JP (1) | JP7192561B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016061970A (ja) | 2014-09-18 | 2016-04-25 | 株式会社東芝 | 音声対話装置、方法およびプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3322140B2 (ja) * | 1996-10-03 | 2002-09-09 | トヨタ自動車株式会社 | 車両用音声案内装置 |
US7640164B2 (en) * | 2002-07-04 | 2009-12-29 | Denso Corporation | System for performing interactive dialog |
JP2009254544A (ja) | 2008-04-16 | 2009-11-05 | Toyota Motor Corp | 乗員情報取得装置及び乗員情報取得システム、並びにこれを用いた車両制御装置及び車両制御システム |
US9858925B2 (en) * | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US9798799B2 (en) * | 2012-11-15 | 2017-10-24 | Sri International | Vehicle personal assistant that interprets spoken natural language input based upon vehicle context |
WO2014128273A1 (en) * | 2013-02-21 | 2014-08-28 | Iee International Electronics & Engineering S.A. | Imaging device based occupant monitoring system supporting multiple functions |
JP6481643B2 (ja) | 2016-03-08 | 2019-03-13 | トヨタ自動車株式会社 | 音声処理システムおよび音声処理方法 |
US10303772B2 (en) * | 2016-07-29 | 2019-05-28 | International Business Machines Corporation | Measuring mutual understanding in human-computer conversation |
US10521512B2 (en) * | 2017-05-26 | 2019-12-31 | Bose Corporation | Dynamic text-to-speech response from a smart speaker |
-
2019
- 2019-02-20 JP JP2019028487A patent/JP7192561B2/ja active Active
- 2019-12-18 US US16/718,309 patent/US11295742B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016061970A (ja) | 2014-09-18 | 2016-04-25 | 株式会社東芝 | 音声対話装置、方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20200265837A1 (en) | 2020-08-20 |
JP2020134328A (ja) | 2020-08-31 |
US11295742B2 (en) | 2022-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11153733B2 (en) | Information providing system and information providing method | |
CN110166896B (zh) | 语音提供方法、语音提供系统和服务器 | |
JP6604151B2 (ja) | 音声認識制御システム | |
JP2010128099A (ja) | 車載用音声情報提供システム | |
JP2017090612A (ja) | 音声認識制御システム | |
JP2009251388A (ja) | 母国語発話装置 | |
CN111007968A (zh) | 智能体装置、智能体提示方法及存储介质 | |
JP6459330B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP2020060861A (ja) | エージェントシステム、エージェント方法、およびプログラム | |
JP7192561B2 (ja) | 音声出力装置および音声出力方法 | |
CN109243457B (zh) | 基于语音的控制方法、装置、设备及存储介质 | |
JP2019074498A (ja) | 運転支援装置 | |
CN110194181B (zh) | 驾驶支持方法、车辆和驾驶支持系统 | |
JP4478146B2 (ja) | 音声認識システム、音声認識方法およびそのプログラム | |
CN110737422A (zh) | 一种声音信号采集方法及装置 | |
JP2004301875A (ja) | 音声認識装置 | |
JP2020154013A (ja) | 車両用注意喚起装置、車両用注意喚起方法及びプログラム | |
WO2022137534A1 (ja) | 車載用音声認識装置及び車載用音声認識方法 | |
JP6596771B2 (ja) | 情報提供装置および情報提供方法 | |
JP2020060623A (ja) | エージェントシステム、エージェント方法、およびプログラム | |
JP2016149014A (ja) | 対話装置 | |
JP2021072064A (ja) | 認知機能診断システム | |
JP2019212168A (ja) | 音声認識システムおよび情報処理装置 | |
JP2008309865A (ja) | 音声認識装置および音声認識方法 | |
JP2009086132A (ja) | 音声認識装置、音声認識装置を備えたナビゲーション装置、音声認識装置を備えた電子機器、音声認識方法、音声認識プログラム、および記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210526 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220406 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220715 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221121 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7192561 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |